博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
自然语言处理-感述
阅读量:7018 次
发布时间:2019-06-28

本文共 431 字,大约阅读时间需要 1 分钟。

hot3.png

    最近花了点时间学习nlp--实际只是学习使用nltk和伴随它出现的gensim。

    也许nlp在国内普及的时间还不是很长,绝大多数资料都来自nltk和gensim的官网,国内最多的例子止于演示一下nltk分词/划分词性,有点实效的是一篇用于比较Coursera上课程的相似度的文章,算是我入门学习的一个灯塔(一开始没有nlp的基础,只能先从更好理解的中文内容开始    =_=!  ),不过其中也没有很好的结合语料库,算法也只有LSI的演示,文章内容和代码也欠缺更好的整理(不是在说作者坏话,但的确有不少改进空间。。。)

    除了资料问题外,nlp的场景也有不少门槛。没有更好资源的情况下,也仅仅可以在分词,分析一下少量数据相似情况。也许在大公司内有更多用武之地,但对普及和推动nlp还嫌不足。

    我会将这段时间对nltk的使用过程和代码陆续放上来,希望对需要入门nlp的后人有用。

        

转载于:https://my.oschina.net/kakablue/blog/314893

你可能感兴趣的文章
《基于MFC的OpenGL编程》Part 6 Keyboard and Mouse Control
查看>>
Java 实现的各种经典的排序算法小Demo
查看>>
DZ验证码不显示等
查看>>
Android 借助Stetho在Chrome上调试Android网络、数据库、Sharedpreferences
查看>>
77.4. pyinotify
查看>>
JsonHelper(Json帮助类)
查看>>
sqlalchemy 的 ORM 与 Core 混合方式使用示例
查看>>
Servlet过滤器,Servlet过滤器创建和配置
查看>>
java类过滤器,防止页面SQL注入
查看>>
MiniApp微信小程序入口在安卓手机桌面
查看>>
微信小程序将超越传统App?
查看>>
CentOS7安装mysql提示“No package mysql-server available
查看>>
开源BTS产品中存在多处漏洞,攻击者或可劫持手机通讯基站
查看>>
MSSQL · 最佳实践 · SQL Server三种常见备份
查看>>
JS编程建议——58:灵活使用Arguments
查看>>
《Programming WPF》翻译 第9章 2.选择一个基类
查看>>
使用 Sketch 和 Pixate 构建 Material Design 原型 - 第三部分
查看>>
.NET Core多平台开发体验[3]: Linux (Windows Linux子系统)
查看>>
人工智能将有效帮助数据中心降低运营成本
查看>>
5G NR标准制定加速 将对运营商计划产生重大影响
查看>>