重要提示:请勿将账号共享给其他人使用,违者账号将被封禁!
查看《购买须知》>>>
首页 > 公务员考试
网友您好,请在下方输入框内输入要搜索的题目:
搜题
拍照、语音搜题,请扫码下载APP
扫一扫 下载APP
题目内容 (请给出正确答案)
[多选题]

我们想要训练一个ML模型,样本数量有100万个,特征维度是5000,面对如此大数据,如何有效地训练模型()。

A.对训练集随机采样,在随机采样的数据上建立模型

B.尝试使用在线机器学习算法

C.使用PCA算法减少特征维度

答案
查看答案
更多“我们想要训练一个ML模型,样本数量有100万个,特征维度是5000,面对如此大数据,如何有效地训练模型()。”相关的问题

第1题

用决策树训练一个分类器模型,树的每个叶子结点代表了()信息。

A.样本数量

B.无实际意义

C.分类标签

D.变量数量

点击查看答案

第2题

假设我们拥有一个已完成训练的、用来解决车辆检测问题的深度神经网络模型,训练所用的数据集由汽车和卡车的照片构成,而训练目标是检测出每种车辆的名称(车辆共有10种类型)。现在想要使用这个模型来解决另外一个问题,问题数据集中仅包含一种车(福特野马)而目标变为定位车辆在照片中的位置()。

A.除去神经网络中的最后一层,冻结所有层然后重新训练

B.对神经网络中的最后几层进行微调,同时将最后一层(分类层)更改为回归层

C.使用新的数据集重新训练模型

D.所有答案均不对

点击查看答案

第3题

我们想要减少数据集中的特征数,即降维.选择以下适合的方案()1.使用前向特征选择方法2.使用后向特

我们想要减少数据集中的特征数,即降维.选择以下适合的方案()

1.使用前向特征选择方法

2.使用后向特征排除方法

3.我们先把所有特征都使用,去训练一个模型,得到测试集上的表现.然后我们去掉一个特征,再去训练,用交叉验证看看测试集上的表现.如果表现比原来还要好,我们可以去除这个特征.

4.查看相关性表,去除相关性最高的一些特征

A.1和2

B.2,3和4

C.1,2和4

D.All

点击查看答案

第4题

工信部发文:20个5G应用案例已经成熟来文中,基础条件:企业对产品/物料缺陷种类有明确定义,具有一定数量的缺陷样本用于机器算法模型训练,现场环境开阔,具备稳定的光源条件及视觉质检设备安装条件,现场可实现5G网络覆盖,质检终端具备5G网络接入能力。是属于()。

A.机器视觉质检

B.厂区智能物流

C.无人智能巡检

D.生产现场监测

点击查看答案

第5题

下面三张图展示了对同一训练样本,使用不同的模型拟合的效果(蓝色曲线)。那么,我们可以得出哪些结论()

A.第1个模型的训练误差大于第2个、第3个模型

B.最好的模型是第3个,因为它的训练误差最小

C.第2个模型最为“健壮”,因为它对未知样本的拟合效果最好

D.第3个模型发生了过拟合

点击查看答案

第6题

利用WAGE2.RAW中的数据估计一个简单回归,以便用智商(IQ)来解释月薪(wage)。 (i)求出样本中的平
利用WAGE2.RAW中的数据估计一个简单回归,以便用智商(IQ)来解释月薪(wage)。

(i)求出样本中的平均工资和平均IQ。IQ的样本标准差是多少?(总体中的IQ已标准化为平均值是100,标准差是15。)

(ii)估计一个简单回归模型,其中IQ提高一个单位导致wage变化相同的数量。利用这个模型计算IQ提高15个单位时,工资的预期变化。10能够解释大多数工资波动吗?

(iii)现在再估计一个模型,其中IQ提高一个单位对工资具有相同的百分比影响。如果IQ提高15个单位,预期工资提高的百分比大约是多少?

点击查看答案

第7题

我们想要在大数据集上训练决策树模型,为了使用较少的时间,可以:( )。

A.增加树的深度

B.增大学习率

C.减少树的深度

D.减少树的数量

点击查看答案

第8题

你正在训练一个分类逻辑回归模型。以下哪项陈述是正确的?

A.将正则化引入到模型中,总是能在训练集上获得相同或更好的性能

B.在模型中添加许多新特性有助于防止训练集过度拟合

C.将正则化引入到模型中,对于训练集中没有的样本,总是可以获得相同或更好的性能

D.向模型中添加新特征总是会在训练集上获得相同或更好的性能

点击查看答案

第9题

线性回归中,我们可以使用最小二乘法来求解系数,下列关于最小二乘法说法正确的是?( )

A.只适用于线性模型,不适合逻辑回归模型等其他模型

B.不需要选择学习率

C.当特征数量很多的时候,运算速度会很慢

D.不需要迭代训练

点击查看答案

第10题

所谓的训练数据,就是经过预处理后,有相对稳妥、精确的特征描述的数据集,以“样本”形式参与模型开发工作。()
点击查看答案

第11题

过拟合的解决办法有()。

A.增加训练集的数据量

B.正则化方法

C.增加样本的数量

D.增加训练的次数

点击查看答案
下载APP
关注公众号
TOP
重置密码
账号:
旧密码:
新密码:
确认密码:
确认修改
购买搜题卡查看答案 购买前请仔细阅读《购买须知》
请选择支付方式
  • 微信支付
  • 支付宝支付
点击支付即表示同意并接受了《服务协议》《购买须知》
立即支付 系统将自动为您注册账号
已付款,但不能查看答案,请点这里登录即可>>>
请使用微信扫码支付(元)

订单号:

遇到问题请联系在线客服

请不要关闭本页面,支付完成后请点击【支付完成】按钮
遇到问题请联系在线客服
恭喜您,购买搜题卡成功 系统为您生成的账号密码如下:
重要提示:请勿将账号共享给其他人使用,违者账号将被封禁。
发送账号到微信 保存账号查看答案
怕账号密码记不住?建议关注微信公众号绑定微信,开通微信扫码登录功能
请用微信扫码测试
优题宝