NLP汉语自然语言处理原理与实践1-2章

我使用的教材是郑捷的NLP汉语自然语言处理原理与实践

示例代码下载地址:http://www.threedweb.cn/data/attachment/bigupload/NLPBook.zip

记录一下安装pyltp过程中遇到的问题

按照书上的说明,首先我想在Win10上安装pyltp,但是一直会出各种奇怪的问题安装失败,原因是因为ltp3.4不兼容win10,所以还是得老老实实在空虚的泰坦上安装,我让空虚帮我开了个账号,并且在我的账号下安装了Anaconda,Anaconda里面已经自带Python3,Pip,Scipy,Numpy等包了,所以非常方便,而且也和原来的Python2环境隔离了开来。安装好Anaconda后按照书上的说明即可把环境安装好。

为了方便编译,我在win10使用Pycharm远程调用Ubuntu上的解释器并且回传编译结果,这样就可以在win10上写代码,而在Linux上跑,非常方便。登录远程服务器的软件建议使用MobaXterm,空虚倾力推荐,6的一比。

具体教程参考空虚的教程:http://paranoth.me/2018/03/19/Pycharm%E8%BF%9C%E7%A8%8B%E8%B0%83%E8%AF%95%E4%BD%BF%E7%94%A8%E6%9C%8D%E5%8A%A1%E5%99%A8%E8%B5%84%E6%BA%90/

运行代码的过程中前面基本都没有问题,因为书上的代码是Python2,但实际上我的运行环境是Python3,这里说一下要注意的地方。

1. UTF8环境

这句话在Python2中经常出现,因为要中文输出调格式,但是Python3中本身就是UTF8环境,所以不需要它,注释掉

2. Print

Python3的print语句写成了对象,所以要加括号。

3. 语义角色标注模块

第1.7节的示例程序,语义角色标注模块,新版本的ltp做了更新:

更新好的代码如下所示