集体智慧编程
2017-09-15第1章 集体智慧导言
-
解释蕴藏于机器学习背后的概念,解释如何将其应用于诸多不同的领域。以及如何利用它对 搜集自许多不同人群的数据进行分析,并从中得出结论。
- 集体智慧:为了创造新的想法,而将一群人的行为,偏好或思想组合在一起。
- 学习型算法:市场预测,生物工艺学,金融欺诈侦测,机器视觉,产品市场化,供应链优化, 股票市场分析,国家安全。
第2章 提供推荐
- 欧几里德距离,皮尔逊相关度;
- 基于用户 Or 基于物品,进行分析过滤
第3章 发现群组
- 数据聚类
- 监督学习和无监督学习;聚类属于无监督学习,其目的就是采集数据,找出不同的群组。
- 单词向量
- 分级聚类
- 绘制树状图
第4章 搜索与排名
- 爬虫
- 建立索引
- 如何建爬虫库,已经过索引的URL列表,单词列表,单词在文档中位置的列表,,文档之间的链接信息,URLID表
- 加入索引
- 基于内容的排名,单词频度,文档位置,单词距离
- 归一化函数
- 利用外部回指链接,简单计数加权,PageRank算法0.85的阻尼因子,网页的重要性是 依据指向该网页的所有其他网页的重要性,以及这些网页中所包含的链接数求得的。
-
利用链接文本