Q1

为了找到线性SVM分类器的分离平面,我们需要理解这两个样本点的位置和他们的分类:

正样本点特征向量为 ((0, -1))。负样本点特征向量为 ((2, 3))。

SVM的目标是找到一个决策边界(直线),在这两个点之间实现线性分离。

假设线性分类器的分离平面方程为 (ax + by = c)。我们通过这两个点的x和y值,找到它们的距离中点,然后确定一个合适的分离线。

因正样本点在直线的左下部分,而负样本点在右上部分,显然的分离线大概会接近这两个点的几何中间。

可以尝试选项来判别:

对于 (2x + y = 4),把两个点代入后发现: ◦ 对正样本 ((0, -1)),(2 \cdot 0 + (-1) = -1) ,小于4. ◦ 对负样本 ((2, 3)),(2 \cdot 2 + 3 = 7),大于4.

符合分离条件,因此正确答案是A: (2x + y = 4)。

Q2

在选项中,正确的陈述是:

B: 当训练数据较多时更容易发生过拟合。

在机器学习中,过拟合指的是模型在训练数据上表现很好,但在新数据或者测试数据上表现较差。这通常发生在训练数据量较大或者模型复杂度较高时,因为模型可能会过于“迎合”训练集的数据特性,而忽视了泛化能力。

因此,B选项的陈述是正确的。

Q3

计算三个独立均匀分布在 ((0, 1)) 的变量的最小值的期望。