题目内容（请给出正确答案）

[多选题]

我们想要训练一个ML模型，样本数量有100万个，特征维度是5000，面对如此大数据，如何有效地训练模型（）。

A.对训练集随机采样，在随机采样的数据上建立模型

B.尝试使用在线机器学习算法

C.使用PCA算法减少特征维度

查看答案

如果结果不匹配，请联系老师获取答案

您可能会需要：

重置密码查看订单联系客服

安装优题宝APP，拍照搜题省时又省心！

更多“我们想要训练一个ML模型，样本数量有100万个，特征维度是5…”相关的问题

第1题

我们想要减少数据集中的特征数，即降维.选择以下适合的方案：（）。

A.使用前向特征选择方法

B.使用后向特征排除方法

C.我们先把所有特征都使用，去训练一个模型，得到测试集上的表现.然后我们去掉一个特征，再去训练，用交叉验证看看测试集上的表现.如果表现比原来还要好，我们可以去除这个特征

D.查看相关性表，去除相关性最高的一些特征

点击查看答案

第2题

工信部发文：20个5G应用案例已经成熟来文中，基础条件：企业对产品/物料缺陷种类有明确定义，具有一定数量的缺陷样本用于机器算法模型训练，现场环境开阔，具备稳定的光源条件及视觉质检设备安装条件，现场可实现5G网络覆盖，质检终端具备5G网络接入能力。是属于()。

A.机器视觉质检

B.厂区智能物流

C.无人智能巡检

D.生产现场监测

点击查看答案

第3题

人工智能技术有巨大的潜能改变人类命运，但同样可以被恶意攻击者利用，用以制作高级持续性威胁AI技术面临的攻击风险为（）

A.攻击者可能在模型中植入后门并实施高级攻击;由于AI模型的不可解释性，在模型中植入的恶意后门难以被检测

B.攻击者同样可以在判断阶段对要判断的样本加入少量噪音，刻意改变判断结果，影响AI模型推理能力

C.训练模型时的样本往往覆盖性不足，使得模型鲁棒性不强;模型面对恶意样本时，无法给出正确的判断结果

D.在用户提供训练数据的场景下，攻击者能够通过反复查询训练好的模型获得用户的隐私信息

点击查看答案

第4题

想要完美的塑造语音亲和力，我们需要进行的专项训练主要包括()。

A.共鸣运用

B.节奏变化

C.吐字归音

D.气息控制

点击查看答案

第5题

Scratch有一个“画笔”模块，想要清空掉所有角色留在舞台上的痕迹，我们需要用到画笔中（）积木

A.落笔

B.抬笔

C.全部擦除

D.图章

点击查看答案

第6题

你觉得为什么要做交叉验证呢？（)

A.评估模型的预测性能

B.判断训练后的模型如何在样本之外的测试数据上执行

C.节省因收集整理数据而消耗的时间

D.以上均对

点击查看答案

第7题

古时，有一个时代的女子，流行在脸上装饰黑色的圆点，她们模仿的似乎是我们费时费力、花费金钱想要去掉的斑点。请问这主要是什么朝代的风尚？（)

A.宋朝

B.唐朝

C.汉朝

点击查看答案

第8题

本题利用401KSUBS.RAW中的数据。(i) 计算样本中nettfa的平均值、标准差、最小值和最大值。(ii) 检

本题利用401KSUBS.RAW中的数据。（i) 计算样本中nettfa的平均值、标准差、最小值和最大值。（ii) 检

本题利用401KSUBS.RAW中的数据。

(i) 计算样本中nettfa的平均值、标准差、最小值和最大值。

(ii) 检验假设平均nettfa不会因为401(k) 资格状况而有所不同，使用双侧对立假设。估计差异的美元数量是多少？

(iii)根据计算机习题C7.9的第(ii)部分，e401k在一个简单回归模型中显然不是外生的，起码它随着收入和年龄而变化。以收入、年龄和e40lk作为解释变量估计nettfa的一个多元线性回归模型。收入和年龄应该以二次函数形式出现。现在，估计401(k)资格的美元效应是多少？

(iv) 在第(iii) 部分估计的模型中，增加交互项e401k·(age-41) 和e401k·(age-41)2 。注意样本中的平均年龄约为41岁，所以在新模型中，e401k的系数是401(k)资格在平均年龄处的估计效应。哪个交互项显著？

(v)比较第(iii)和(iv)部分的估计值，401(k)资格在41岁处的估计效应差别大吗？请解释。

(vi) 现在，从模型中去掉交互项，但定义5个家庭规模虚拟变量：fsize l， j size2，f size 3， f size 4和f size 5。对有5个或5个以上成员的家庭， fsize 5等于1。在第(iii) 部分估计的模型中，增加家庭规模虚拟变量，记得选择一个基组。这些家庭虚拟变量在1%的显著性水平上显著吗？

(vii) 现在，针对模型

在容许截距不同的情况下，做5个家庭规模类别的邹至庄检验。约束残差平方和SSR，从第(vi) 部分得到，因为那里回归假定了相同斜率。无约束残差平方和SSRUR=SSR1+SSR2 +…+SSR5 ，其中SSRf是从仅用家庭规模f估计的方程中得到的残差平方和。你应该明白，无约束模型中有30个参数(5个截距和25个斜率)，而约束模型中有10个参数(5个截距和5个斜率)。因此，带检验的约束个数是q=20，而且无约束模型的df为9275-30=9245。

点击查看答案

第9题

路测开始前，我们需要新建一个工程，下列选项中不是必须导入的信息有：（)

A.基站信息表

B.区域话务量

C.邻区列表

D.传播模型

点击查看答案

第10题

建立一个经济计量模型包括设定理论模型、收集样本数据并估计模型和()三个步骤。

建立一个经济计量模型包括设定理论模型、收集样本数据并估计模型和（)三个步骤。

点击查看答案