A.文本分类是指按照预先定义的主题类别,由计算机自动地为文档集合中的每个文档确定一个类别
B.文本分类大致可分为基于知识工程的分类系统和基于机器学习的分类系统
C.文本的向量形式一般基于词袋模型构建,该模型考虑了文本词语的行文顺序
D.构建文本的向量形式可以归结为文本的特征选择与特征权重计算两个步骤
A.会用数词描述事物的排列顺序和位置
B.能感知和区分物体的粗细、厚薄、轻重等量方面的特点,并能用相应的词语描述
C.能通过实物操作或其它方法进行10以内的加减运算
D.能通过数数比较两组物体的多少
A.字词的重要性随它在文件中出现的次数成正比
B.将一些生僻字误当作文档关键词
C.只考虑特征词和文本之间的关系,忽略了一个特征项在不同类别间的分布情况
D.没有考虑特征词的位置因素对文本的区分度
A.87版电视剧《红楼梦》中贾宝玉的扮演者欧阳奋强日前在某网站开设微博,言语诙谐、机智幽默,颠覆了不少网友以往的印象
B.千古奇书、文学名著《红楼梦》的作者曹雪芹,不仅文采飞扬,而且多才多艺,他对于风筝的制作工艺还颇有造诣和研究,是一位名副其实的风筝高手。(语序不当)
C.3月12日,大型昆曲豪华青春版《红楼梦》,在BTV大剧院进行彩排演出,部分两会代表受邀到场观看。(语序不当)
D.虽然王夫人与王熙凤是嫡亲的姑侄女关系,但都打着自己的算盘,经过短期的利益合作后,终于分开了,这是一条亲情与利益矛盾的路,是一条不能统一的路。(关联词语和主语的位置不当)