我们想要训练一个ML模型,样本数量有100万个,特征维度是5000,面对如此大数据,如何有效地训练模型()。
A.对训练集随机采样,在随机采样的数据上建立模型
B.尝试使用在线机器学习算法
C.使用PCA算法减少特征维度
A.对训练集随机采样,在随机采样的数据上建立模型
B.尝试使用在线机器学习算法
C.使用PCA算法减少特征维度
第2题
A.除去神经网络中的最后一层,冻结所有层然后重新训练
B.对神经网络中的最后几层进行微调,同时将最后一层(分类层)更改为回归层
C.使用新的数据集重新训练模型
D.所有答案均不对
第3题
我们想要减少数据集中的特征数,即降维.选择以下适合的方案()
1.使用前向特征选择方法
2.使用后向特征排除方法
3.我们先把所有特征都使用,去训练一个模型,得到测试集上的表现.然后我们去掉一个特征,再去训练,用交叉验证看看测试集上的表现.如果表现比原来还要好,我们可以去除这个特征.
4.查看相关性表,去除相关性最高的一些特征
A.1和2
B.2,3和4
C.1,2和4
D.All
第4题
A.机器视觉质检
B.厂区智能物流
C.无人智能巡检
D.生产现场监测
第5题
A.第1个模型的训练误差大于第2个、第3个模型
B.最好的模型是第3个,因为它的训练误差最小
C.第2个模型最为“健壮”,因为它对未知样本的拟合效果最好
D.第3个模型发生了过拟合
第6题
(i)求出样本中的平均工资和平均IQ。IQ的样本标准差是多少?(总体中的IQ已标准化为平均值是100,标准差是15。)
(ii)估计一个简单回归模型,其中IQ提高一个单位导致wage变化相同的数量。利用这个模型计算IQ提高15个单位时,工资的预期变化。10能够解释大多数工资波动吗?
(iii)现在再估计一个模型,其中IQ提高一个单位对工资具有相同的百分比影响。如果IQ提高15个单位,预期工资提高的百分比大约是多少?
第8题
A.将正则化引入到模型中,总是能在训练集上获得相同或更好的性能
B.在模型中添加许多新特性有助于防止训练集过度拟合
C.将正则化引入到模型中,对于训练集中没有的样本,总是可以获得相同或更好的性能
D.向模型中添加新特征总是会在训练集上获得相同或更好的性能
第9题
A.只适用于线性模型,不适合逻辑回归模型等其他模型
B.不需要选择学习率
C.当特征数量很多的时候,运算速度会很慢
D.不需要迭代训练