全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
1511 2
2019-04-18

这个是我在github https://github.com/pommedeterresautee/fastrtext/issues/34 上提问的,用fastrtext 来做文本分类预测的,以下是英文直接复制过来的,哪位大神帮忙看看,多谢多谢~

I got an issue with Chinese text classification prediction model as folloing:

test_sentences$text2[9]
[1] "蛋白粉 开封 后 两个 月 在 次 食用 味道 发苦"
predict(model,test_sentences$text2[9])
[[1]]
__label__262
0.5312194

predict(model, "蛋白粉 开封 后 两个 月 在 次 食用 味道 发苦")
[[1]]
__label__314
0.9935217

Basically, after you trained the model using "fastrtext", if you try to predict a Chinese tokenized text and put it as an object (e.g. test_sentences$text2[9] in my case), it will give you a wrong prediction with low probability. If you just simply copy the tokenized Chinese text into the prediction model like I did above, it will give a correct one with high probability. I am really confused about this situation. Anyone can help with it? Much appreciated!


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2019-4-19 15:08:03
您好,如果您的求助没有解决,请到项目交易发布需求,会有更快更专业的用户帮助您 https://bbs.pinggu.org/prj/
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2019-11-26 10:15:54
您好!请问您的问题解决了吗?能否加我QQ912393320指教一下,我也遇到了同样的问题
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群