机器学习和人工智能实践
· 2 min read
关键术语
- 监督学习(Supervised Learning)--一种使用标注的历史数据来训练模型以预测未标注的未来数据的机器学习方法。
- 无监督学习(Unsupervised Learning)--一种在无标签数据中发现隐藏模式和关系的机器学习方法。
- 聚类- 一种无监督学习技术,根据相似性对数据点进行分组,并将其分配到聚类中。
- K-均值聚类 - 一种流行的聚类算法,通过计算分配给某个聚类的所有数据点的均值,将数据划分为 k 个聚类。
- 诊断- 肘部图、轮廓分析和距离图等可视化工具,用于评估和调整聚类模型的性能。
- 并行化- 在多个 CPU 内核上同时运行 k-means 等聚类计算,以提高性能。
监督学习和无监督学习
监督学习你需要知道数据的 label
- 股票问题: 通过过去确定性的交易价格数据来预测股票价格
- 房价计算问题
无监督学习则是你不知道数据的 label,尝试发现 label 来找到新事物得出新结论
- 分析事物之间的关系
- 聚类问题: 分析用户类型