
为什么应该从静态 API 令牌迁移到 OAuth 2.0
世界每天都在变得越来越 “智能”,为了满足消费者的期望,公司越来越多地使用机器学习算法来简化事情。您可以看到它们在最终用户设备中使用,例如:通过人脸识别解锁智能手机或信用卡欺诈检测(如触发异常消费警报)。
人工智能(AI)和机器学习有两种基本方法:监督学习和无监督学习。它们的主要区别在于,一种方法使用标记数据来帮助预测结果,而另一种方法则不使用标记数据。不过,这两种方法之间也存在一些细微差别,在一些关键领域,其中一种方法优于另一种方法。本篇文章将阐明两者的区别,以便您根据自身情况选择最佳方法。
监督学习是一种机器学习方法,它通过使用标记数据集来定义。这些数据集旨在训练或 “监督 “算法对数据进行分类或准确预测结果。利用标注的输入和输出,模型可以衡量其准确性,并随着时间的推移不断学习。
在数据挖掘过程中,有监督学习可分为两类问题:分类和回归:
无监督学习使用机器学习算法来分析和聚类无标记的数据集。这些算法无需人工干预即可发现数据中隐藏的模式(因此被称为 “无监督”)。
无监督学习模型主要用于三项任务:聚类、关联和降维:
这两种方法的主要区别在于是否使用标记数据集。简单地说,有监督学习使用有标记的输入和输出数据,而无监督学习算法则不使用。
在监督学习中,算法通过迭代对数据进行预测并调整以获得正确答案,从而从训练数据集中 “学习”。虽然有监督学习模型往往比无监督学习模型更准确,但它们需要前期的人工干预来对数据进行适当标注。例如,监督学习模型可以根据一天中的时间、天气状况等预测你的通勤时间。但首先,你必须对它进行训练,让它知道阴雨天气会延长驾驶时间。
相比之下,无监督学习模型可以自行发现未标记数据的固有结构。需要注意的是,它们仍然需要人工干预来验证输出变量。例如,无监督学习模型可以识别出在线购物者经常同时购买几组产品。但是,数据分析师需要验证,推荐引擎将婴儿服装与尿布、苹果酱和奶嘴杯的订单组合在一起是否合理。
选择适合您的情况的方法取决于数据科学家如何评估数据的结构和数量以及使用案例。要做出决定,请务必做到以下几点:
在有监督学习中,对大数据进行分类是一项真正的挑战,但结果却非常准确和可信。相比之下,无监督学习可以实时处理大量数据。但是,数据如何聚类缺乏透明度,结果不准确的风险也更高。这就是半监督学习的优势所在。
无法决定使用监督学习还是无监督学习?半监督学习是一种令人满意的学习方法,您可以使用一个训练数据集,其中既有标注数据,也有未标注数据。在难以从数据中提取相关特征时,以及在拥有大量数据时,半监督学习尤其有用。
半监督学习非常适合医疗图像,少量的训练数据就能显著提高准确性。例如,放射科医生可以为一小部分 CT 扫描标注肿瘤或疾病,这样机器就能更准确地预测哪些病人可能需要更多的医疗关注。
机器学习模型是获取数据洞察力以改善我们的世界的强大方法。要了解有关监督学习和无监督学习的具体算法的更多信息,我们建议您深入研究有关这些技术的 Learn Hub 文章。我们还建议您查看更进一步的博文,详细了解深度学习和神经网络。
什么是监督学习?https://www.ibm.com/cloud/learn/supervised-learning
什么是无监督学习?https://www.ibm.com/cloud/learn/unsupervised-learning
人工智能 vs. 机器学习 vs. 深度学习 vs. 神经网络:有什么区别?https://www.ibm.com/cloud/blog/ai-vs-machine-learning-vs-deep-learning-vs-neural-networks
数据差异化:了解如何将单一的技术概念融入整体数据战略,从而推动业务价值。
https://www.ibm.com/resources/the-data-differentiator/data-strategy
原文链接:Supervised vs. Unsupervised Learning: What’s the Difference?