Mint15安装moses教程

我的系统是Linux Mint15,64位的系统,gcc的版本是4.7.3,之后我将以此系统为例演示编译配置moses的步骤。

#安装准备工作#

##安装boost及其他依赖包

1
sudo apt-get installlibboost-all-dev build-essential libz-dev libbz2-dev

boost的安装包还是很大的,我尝试从boost官网下载最新版本源码在本地编译,可是在后来编译moses时会报缺失boost包的错,所以推荐使用命令安装。

##从github上下载moses源码##

1
git clone git://github.com/moses-smt/mosesdecoder.git

熟悉git的人应该都知道,上面的命令是将github上moses的源码下载到本地(需要安装git,具体请搜索),git是很好的代码同步工具,推荐尝试。之前看到有些关于moses的教程,可能由于时间比较久的关系,很多的内容已经不适合,所以建议大家如果不明白的地方,多看看官方网站提供的教程,都是比较新的资料。

##编译moses源码##

1
2
cd .../mosesdecoder/ #之前下载的moses源码目录
./bjam -j4 #j之后的数字代表的是cpu运算核心的个数,我是i5的,所以是4

编译大概需要十分钟到半小时的样子,具体时间依据电脑配置不同而变化;bjam后可以跟很多可扩展的选项,不过官网的教程说如果boost安装好的话,应该就不需要加上其他的选项了。在后面的配置过程中,也没有出现相关的问题。

##验证安装是否正确##
首先下载测试数据

1
2
3
4
cd .../mosesdecoder
wget http://www.statmt.org/moses/download/sample-models.tgz
tar xzf sample-models.tgz
cd sample-models

moses自带了语言建模工具包KenLM,数据默认是配置好的,不要改动。

1
2
cd .../mosesdecoder/sample-models
~/mosesdecoder/bin/moses -f phrase-model/moses.ini < phrase-model/in > out

如果安装正确的话,在out文件中应该是两行it is a small house。

#结语#
本篇介绍moses的编译工作,在接下来的博文里会继续介绍moses相关的其他工具的安装及EMS翻译系统的搭建工作。