文章详情页
python - 用sklearn求大文本的tfidf特征?
问题描述
上面的数据是从reuters数据集中取得7303个训练集,用sklearn对其取tfidf特征,得到的结果都是0,这是怎么回事?
当我从这些数据中取一部分时,对于这些少部分数据能够得到正确的tfidf结果。
问题解答
回答1:上代码,可能是你精度太低或者min_count导致的
比如词频是1,总词数1e9,对应的tf就是1e-9,被忽略了。
相关文章:
1. html5 - 目前 公司App 嵌入H5页面 做个 手机支付功能 没有做过 所以 请求各位有经验的 给个思路2. javascript - 小白求解:mac 下如何设置nodejs express的 NODE_NEV 环境变量3. javascript - 实参和形参有哪些通俗的命名吗?尤其形参4. 找一个权威、实战的微信扫码授权登录网站的开发教程或者文章5. mysql5.7 json查询支持6. Python如何考虑代码注入安全?7. javascript - avalon.js ms-on 事件绑定无效 ?8. javascript - 请问一下react-native 布局的时候,尺寸的大小是如何确定的呢?9. javascript - js 修改表格元素的,可以用DOM操作实现吗?10. javascript - jQuery中live事件在移动微信端下没有效果;代码如下
排行榜