首页 > 财会类考试
题目内容 (请给出正确答案)
[多选题]

下列哪些是TF-IDF的缺点()。

A.字词的重要性随它在文件中出现的次数成正比

B.将一些生僻字误当作文档关键词

C.只考虑特征词和文本之间的关系,忽略了一个特征项在不同类别间的分布情况

D.没有考虑特征词的位置因素对文本的区分度

查看答案
答案
收藏
如果结果不匹配,请 联系老师 获取答案
您可能会需要:
您的账号:,可能还需要:
您的账号:
发送账号密码至手机
发送
安装优题宝APP,拍照搜题省时又省心!
更多“下列哪些是TF-IDF的缺点()。”相关的问题
第1题
下列哪些属于TF-IDF的应用()。

A.搜索引擎

B.关键词提取

C.文本相似性

D.数据降维

点击查看答案
第2题
以下哪些方法是tf-idf的变种()。

A.TFC

B.EWC

C.ITC

D.IG

点击查看答案
第3题
下列哪一项不是文本预处理中常用方法()

A.去停用词

B.tf-idf

C.drop-out

D.word2vec

点击查看答案
第4题
下列关于自然语言处理中的关键词提取的说法正确的是()。

A.关键词提取是指用人工方法提取文章关键词的方法

B.TF-IDF模型是关键词提取的经典方法

C.文本中出现次数最多的词最能代表文本的主题

D.这个问题设计数据挖掘,文本处理,信息检索等领域

点击查看答案
第5题
TF-IDF中IDF指的是()。

A.词频

B.词在文档中出现的次数

C.逆文档概率

D.词在文档集中出现的概率

E.词在文档集中出现的概率

点击查看答案
第6题
关于TF-IDF模型描述正确的有()。

A.TF意思是词频

B.IDF是逆文本频率

C.该模型基于统计方法

D.在信息检索中应用较少

点击查看答案
第7题
下列哪些是传统RDBMS的缺点()。

A.表结构schema扩展不方便

B.全文搜索功能较弱

C.大数据场景下I/O较高

D.存储和处理复杂关系型数据功能较弱

点击查看答案
第8题
下面哪个算法可以将文本数据转换为数值数据?()

A.TF-IDF

B.决策树

C.PCA

D.DBSCAN

点击查看答案
第9题
下列哪些属于立姿作业的缺点()?

A.不易进行精确而细致的工作

B.不易转换操纵

C.作业过程中不易改变体位

D.容易疲劳

点击查看答案
第10题
什么是选配装配法?它有哪些缺点?
点击查看答案
第11题
以下哪些是PON方式数据专线的缺点?()

A.成本较高

B.组网复杂

C.保密性不足

D.可靠性较低

点击查看答案
退出 登录/注册
发送账号至手机
获取验证码
发送
温馨提示
该问题答案仅针对搜题卡用户开放,请点击购买搜题卡。
马上购买搜题卡
我已购买搜题卡, 登录账号 继续查看答案
重置密码
确认修改