在实际使用机器学习算法时,面对训练集,是如何知道它是线性可分的,还是不可分的??

vps网友提供 05-12 讨论归档 3
是因为尝试使用某种算法,比如 LR ,发现代价函数不收缩,从而确定不合适?
还是有什么标准,一开始就能确定训练集是线性可分的,还是不可分的??

本文由 vps网友提供,转载请注明出处

本文链接: https://www.vpsvsvps.com/discuss/a/1676471755830464512.html

标签:
srlp
05-13

一般现实世界的,默认不可分吧。计算力足够的话,所有模型都强行上一次试试。

tony1016
05-12

@menc 哦,这样子,感谢

menc
05-12

如果维数不高,可以任意取两维打出来看看,多取几次,两维都线性不可分,那么数据集就线性不可分了。

然而我一般不用。
直接上模型。

非线性模型, svm 啊, gbdt 啊,对线性可分的问题拟合能力也不错的。

如果要一个确定的方法确定是线性可分还是线性不可分,那这样的方法是不存在的,要不然 svm 的 kernel function 选什么就不是玄学了。