Q1
为了找到线性SVM分类器的分离平面,我们需要理解这两个样本点的位置和他们的分类:
正样本点特征向量为 ((0, -1))。负样本点特征向量为 ((2, 3))。
SVM的目标是找到一个决策边界(直线),在这两个点之间实现线性分离。
假设线性分类器的分离平面方程为 (ax + by = c)。我们通过这两个点的x和y值,找到它们的距离中点,然后确定一个合适的分离线。
因正样本点在直线的左下部分,而负样本点在右上部分,显然的分离线大概会接近这两个点的几何中间。
可以尝试选项来判别:
对于 (2x + y = 4),把两个点代入后发现: ◦ 对正样本 ((0, -1)),(2 \cdot 0 + (-1) = -1) ,小于4. ◦ 对负样本 ((2, 3)),(2 \cdot 2 + 3 = 7),大于4.
符合分离条件,因此正确答案是A: (2x + y = 4)。
Q2
在选项中,正确的陈述是:
B: 当训练数据较多时更容易发生过拟合。
在机器学习中,过拟合指的是模型在训练数据上表现很好,但在新数据或者测试数据上表现较差。这通常发生在训练数据量较大或者模型复杂度较高时,因为模型可能会过于“迎合”训练集的数据特性,而忽视了泛化能力。
因此,B选项的陈述是正确的。
Q3
计算三个独立均匀分布在 ((0, 1)) 的变量的最小值的期望。