Ruizhi Tech | Notion

为了找到线性SVM分类器的分离平面，我们需要理解这两个样本点的位置和他们的分类：

正样本点特征向量为 ((0, -1))。负样本点特征向量为 ((2, 3))。

SVM的目标是找到一个决策边界（直线），在这两个点之间实现线性分离。

假设线性分类器的分离平面方程为 (ax + by = c)。我们通过这两个点的x和y值，找到它们的距离中点，然后确定一个合适的分离线。

因正样本点在直线的左下部分，而负样本点在右上部分，显然的分离线大概会接近这两个点的几何中间。

可以尝试选项来判别：

对于 (2x + y = 4)，把两个点代入后发现： ◦ 对正样本 ((0, -1))，(2 \cdot 0 + (-1) = -1) ，小于4. ◦ 对负样本 ((2, 3))，(2 \cdot 2 + 3 = 7)，大于4.

符合分离条件，因此正确答案是A: (2x + y = 4)。

在选项中，正确的陈述是：

B: 当训练数据较多时更容易发生过拟合。

在机器学习中，过拟合指的是模型在训练数据上表现很好，但在新数据或者测试数据上表现较差。这通常发生在训练数据量较大或者模型复杂度较高时，因为模型可能会过于“迎合”训练集的数据特性，而忽视了泛化能力。

因此，B选项的陈述是正确的。

计算三个独立均匀分布在 ((0, 1)) 的变量的最小值的期望。