文章详情页

python 利用百度API进行淘宝评论关键词提取

浏览：243日期：2022-06-24 08:30:01

利用百度API自然语言处理技术中的评论观点抽取方面，对淘宝购物的评论进行分析，把关键词进行提取，方便买家快速了解该商品的相关特点，具体实现过程如下：

1、创建相关新应用

首先，需要登录百度AI平台，创建一个关于自然语言处理技术的应用（领取免费额度），获得AppID、API Key和Secret Key如下：

然后下载Python的SDK，然后可以通过阅读API的使用手册和自然语言处理技术的观点抽取相关案例：

python 利用百度API进行淘宝评论关键词提取

2、获取Access Token

使用百度API时需要先获取Access Token，并且需要用到上一步获取的参数API Key和Secret Key，在百度给出的使用说明中，建议用POST的方式对URL进行请求来获取access_token，同时可以加入Header，该方式支持UTF-8编码，具体实现代码如下：

import jsonimport timeimport requestsfrom urllib.request import urlopen#定义获取token函数def get_token(): req = Request(Token_url) req.add_header(’Content-Type’, ’application/json; charset=UTF-8’) try: f = urlopen(req,timeout=5) result_str = f.read().decode(’utf-8’) except URLError as err: print(err) result = json.loads(result_str) #返回Access Token字符串 return result[’access_token’]3、分析评论并进行观点抽取

在获取Access Token后就可以使用百度API对评论进行分析并抽取关键词。在使用说明中，调用API时需要输入参数text和type，其中text为需要分析的文本，而type分成了13各类别，具体取值说明如下：

python 利用百度API进行淘宝评论关键词提取

因为本文分析的是淘宝购物评论文本数据，所以该参数取值选择了12。其次，返回格式需要指定输入为UTF-8编码，对于调用后返回的参数，本文用到了prop、adj和sentiment三个参数，解释如下：

python 利用百度API进行淘宝评论关键词提取

具体实现代码如下：

def analysis_comment(host,comment): #定义分析类别（购物） data = json.dumps( { 'text':comment, 'type':12 }) request = Request(url=host,data=data.encode(’utf-8’)) request.add_header(’Content-Type’, ’application/json; charset=UTF-8’) response = urlopen(request) content = response.read().decode(’utf-8’) rdata = json.loads(content) print('--------------------------------------------------------------') print('评论：') print(' ' + comment) print('n评论关键字：') #把积极、中性、消极关键词分类出来并打印 for item in rdata[’items’]: if item[’sentiment’] == 2: print(u' 积极的评论关键词：' + item[’prop’] + item[’adj’]) if item[’sentiment’] == 1: print(u' 中性的评论关键词：' + item[’prop’] + item[’adj’]) if item[’sentiment’] == 0: print(u' 消极的评论关键词：' + item[’prop’] + item[’adj’])4、运行结果

在对上述函数进行定义后，运行改代码，调用函数：

if __name__ == ’__main__’: #定义访问url（API Key和Secret Key换成自己的） Comment_url = 'https://aip.baidubce.com/rpc/2.0/nlp/v2/comment_tag' Token_url = 'https://aip.baidubce.com/oauth/2.0/token?grant_type=client_credentials&client_id=your_API_Key&client_secret=your_Secret_Key' A_t = get_token() host = Comment_url + '?charset=UTF-8&access_token='+A_t comment1 = {'text':'版型不错，颜色很好看，面料非常舒服而且厚度适中'} comment2 = {'text':'上身效果一般，做工也一般，会有点起球，没有想象中好'} comment3 = {'text':'设计做工一点都不好，袖子特别长，衣服比例设计非常差，性价比不高'} comment1 = comment1['text'] comment2 = comment2['text'] comment3 = comment3['text'] analysis_comment(host,comment1) analysis_comment(host,comment2) analysis_comment(host,comment3)

运行结果如下：

python 利用百度API进行淘宝评论关键词提取

然而，从结果中可以看出，在第二句评论中，“一般”这个词应该定义为中性，而该模型将其定义为消极，说明该模型在一定程度上仍存在一些瑕疵，这也是后期需要改进的地方。

以上就是python 利用百度API进行淘宝评论关键词提取的详细内容，更多关于python 淘宝评论关键词提取的资料请关注好吧啦网其它相关文章！

淘宝 Python

上一条：Python爬虫爬取全球疫情数据并存储到mysql数据库的步骤下一条：python pandas合并Sheet,处理列乱序和出现Unnamed列的解决

相关文章：

1. IntelliJ IDEA设置自动提示功能快捷键的方法2. JavaScript中this的运行机制及爬坑指南3. 解决vue scoped scss 无效的问题4. Intellij IDEA 关闭和开启自动更新的提示?5. PHP 范围解析操作符（::）用法分析【访问静态成员和类常量】6. Django实现列表页商品数据返回教程7. IntelliJ IDEA配置Tomcat服务器的方法8. 实现AJAX异步调用和局部刷新的基本步骤9. python线程里哪种模块比较适合10. 编写更好的 Java 单元测试的 7 个技巧

排行榜

					
					python线程里哪种模块比较适合
实现AJAX异步调用和局部刷新的基本步骤
Intellij IDEA 关闭和开启自动更新的提示?
Django实现列表页商品数据返回教程
解决vue scoped scss 无效的问题
PHP 范围解析操作符（::）用法分析【访问静态成员和类常量】
IntelliJ IDEA配置Tomcat服务器的方法
JavaScript中this的运行机制及爬坑指南
IntelliJ IDEA设置自动提示功能快捷键的方法
Android自定义View实现圆弧进度的效果
如何利用python的tkinter实现一个简单的计算器
				

热门标签