首页 > 公务员考试

网友您好，请在下方输入框内输入要搜索的题目：

请输入或粘贴题目内容搜题

搜题

拍照、语音搜题，请扫码下载APP

题目内容（请给出正确答案）

[多选题]

我们想要训练一个ML模型，样本数量有100万个，特征维度是5000，面对如此大数据，如何有效地训练模型（）。

A.对训练集随机采样，在随机采样的数据上建立模型

B.尝试使用在线机器学习算法

C.使用PCA算法减少特征维度

答案

查看答案

发布时间：2023-07-06

更多“我们想要训练一个ML模型，样本数量有100万个，特征维度是5000，面对如此大数据，如何有效地训练模型（）。”相关的问题

第1题

用决策树训练一个分类器模型，树的每个叶子结点代表了（）信息。

A.样本数量

B.无实际意义

C.分类标签

D.变量数量

点击查看答案

第2题

假设我们拥有一个已完成训练的、用来解决车辆检测问题的深度神经网络模型，训练所用的数据集由汽车和卡车的照片构成，而训练目标是检测出每种车辆的名称（车辆共有10种类型）。现在想要使用这个模型来解决另外一个问题，问题数据集中仅包含一种车（福特野马）而目标变为定位车辆在照片中的位置（）。

A.除去神经网络中的最后一层，冻结所有层然后重新训练

B.对神经网络中的最后几层进行微调，同时将最后一层（分类层）更改为回归层

C.使用新的数据集重新训练模型

D.所有答案均不对

点击查看答案

第3题

我们想要减少数据集中的特征数,即降维.选择以下适合的方案（)1.使用前向特征选择方法2.使用后向特

我们想要减少数据集中的特征数,即降维.选择以下适合的方案()

1.使用前向特征选择方法

2.使用后向特征排除方法

3.我们先把所有特征都使用,去训练一个模型,得到测试集上的表现.然后我们去掉一个特征,再去训练,用交叉验证看看测试集上的表现.如果表现比原来还要好,我们可以去除这个特征.

4.查看相关性表,去除相关性最高的一些特征

A.1和2

B.2,3和4

C.1,2和4

D.All

点击查看答案

第4题

工信部发文：20个5G应用案例已经成熟来文中，基础条件：企业对产品/物料缺陷种类有明确定义，具有一定数量的缺陷样本用于机器算法模型训练，现场环境开阔，具备稳定的光源条件及视觉质检设备安装条件，现场可实现5G网络覆盖，质检终端具备5G网络接入能力。是属于()。

A.机器视觉质检

B.厂区智能物流

C.无人智能巡检

D.生产现场监测

点击查看答案

第5题

下面三张图展示了对同一训练样本，使用不同的模型拟合的效果（蓝色曲线)。那么，我们可以得出哪些结论（)

A.第1个模型的训练误差大于第2个、第3个模型

B.最好的模型是第3个，因为它的训练误差最小

C.第2个模型最为“健壮”，因为它对未知样本的拟合效果最好

D.第3个模型发生了过拟合

点击查看答案

第6题

利用WAGE2.RAW中的数据估计一个简单回归，以便用智商（IQ)来解释月薪（wage)。（i)求出样本中的平

利用WAGE2.RAW中的数据估计一个简单回归，以便用智商(IQ)来解释月薪(wage)。

(i)求出样本中的平均工资和平均IQ。IQ的样本标准差是多少？(总体中的IQ已标准化为平均值是100，标准差是15。)

(ii)估计一个简单回归模型，其中IQ提高一个单位导致wage变化相同的数量。利用这个模型计算IQ提高15个单位时，工资的预期变化。10能够解释大多数工资波动吗？

(iii)现在再估计一个模型，其中IQ提高一个单位对工资具有相同的百分比影响。如果IQ提高15个单位，预期工资提高的百分比大约是多少？

点击查看答案

第7题

我们想要在大数据集上训练决策树模型,为了使用较少的时间,可以:( )。

A.增加树的深度

B.增大学习率

C.减少树的深度

D.减少树的数量

点击查看答案

第8题

你正在训练一个分类逻辑回归模型。以下哪项陈述是正确的?

A.将正则化引入到模型中,总是能在训练集上获得相同或更好的性能

B.在模型中添加许多新特性有助于防止训练集过度拟合

C.将正则化引入到模型中,对于训练集中没有的样本,总是可以获得相同或更好的性能

D.向模型中添加新特征总是会在训练集上获得相同或更好的性能

点击查看答案

第9题

线性回归中,我们可以使用最小二乘法来求解系数,下列关于最小二乘法说法正确的是?( )

A.只适用于线性模型,不适合逻辑回归模型等其他模型

B.不需要选择学习率

C.当特征数量很多的时候,运算速度会很慢

D.不需要迭代训练

点击查看答案

第10题

所谓的训练数据，就是经过预处理后，有相对稳妥、精确的特征描述的数据集，以“样本”形式参与模型开发工作。（)

点击查看答案

第11题

过拟合的解决办法有（)。

A.增加训练集的数据量

B.正则化方法

C.增加样本的数量

D.增加训练的次数

点击查看答案

账号：尚未登录

登录没有账号？去注册

搜题明细

联系客服

购买搜题卡

考试指南全部 >

基金从业资格证分级别吗宁夏银行从业资格报名条件基金从业资格考试的有效期是多久？甘肃银行从业资格考试打印准考证入口广西初级银行职业资格考试多少分及格基金从业资格证有效期过了怎么办贵州初级银行职业资格准考证打印时间多长基金从业资格科目二考试内容与难度辽宁初级银行职业资格什么时候打印准考证基金从业资格证的有效期是多久？

下载APP

关注公众号

TOP