我的系统是Linux Mint15,64位的系统,gcc的版本是4.7.3,之后我将以此系统为例演示编译配置moses的步骤。
#安装准备工作#
##安装boost及其他依赖包
boost的安装包还是很大的,我尝试从boost官网下载最新版本源码在本地编译,可是在后来编译moses时会报缺失boost包的错,所以推荐使用命令安装。
##从github上下载moses源码##
熟悉git的人应该都知道,上面的命令是将github上moses的源码下载到本地(需要安装git,具体请搜索),git是很好的代码同步工具,推荐尝试。之前看到有些关于moses的教程,可能由于时间比较久的关系,很多的内容已经不适合,所以建议大家如果不明白的地方,多看看官方网站提供的教程,都是比较新的资料。
##编译moses源码##
编译大概需要十分钟到半小时的样子,具体时间依据电脑配置不同而变化;bjam后可以跟很多可扩展的选项,不过官网的教程说如果boost安装好的话,应该就不需要加上其他的选项了。在后面的配置过程中,也没有出现相关的问题。
##验证安装是否正确##
首先下载测试数据
moses自带了语言建模工具包KenLM,数据默认是配置好的,不要改动。
如果安装正确的话,在out文件中应该是两行it is a small house。
#结语#
本篇介绍moses的编译工作,在接下来的博文里会继续介绍moses相关的其他工具的安装及EMS翻译系统的搭建工作。