为了使用nltk除了需要下载安装nltk外还需要其扩展包。
1. 安装nltk:
pip install nltk
如果出现以下问题:
Resource punkt not found.
Please use the NLTK Downloader to obtain the resource:
>>> import nltk
>>> nltk.download('punkt')
For more information see: https://www.nltk.org/data.html
Attempted to load tokenizers/punkt/english.pickle
Searched in:
- 'C:\\Users\\sss/nltk_data'
- 'E:\\software\\pycharm\\Anaconda\\setup\\nltk_data'
- 'E:\\software\\pycharm\\Anaconda\\setup\\share\\nltk_data'
- 'E:\\software\\pycharm\\Anaconda\\setup\\lib\\nltk_data'
- 'C:\\Users\\sss\\AppData\\Roaming\\nltk_data'
- 'C:\\nltk_data'
- 'D:\\nltk_data'
- 'E:\\nltk_data'
就是说你没有下载NLTK,程序尝试去下面给出的路径中去查找你的nltk_data数据包,但是没有找到。下面就需要下载nltk_data数据到以上任意一个文件夹中。
2. 下载拓展包:nltk_data
方法一:
import nltk
nltk.download()
运行代码之后会出现安装界面,按照要求选择合适位置安装即可,只是速度很慢。
方法二:
去github直接下载nltk_data将该目录下的packages文件夹完整下载下来,可放置在上面提到的任意一个路径中,并修改名字为nltk_data。
方法三:
去网有提供的百度网盘提取码:cnpf下载下来,加压后可放置在上面提到的任意一个路径中,并修改名字为nltk_data。(随便提一下,百度网盘在设置-传输中提供了一个加速的功能,开启后可以在一定程度上提速)
注意:如果程序你确实放在了该目录下,但是程序提示没有找到,那么就根据提示去看下,有的包需要进一步解压。 例如, 提示:
Attempted to load tokenizers/punkt/english.pickle
punkt就需要进一步解压,解压后如下: