集体智慧编程

2017-09-15

第1章集体智慧导言

解释蕴藏于机器学习背后的概念，解释如何将其应用于诸多不同的领域。以及如何利用它对搜集自许多不同人群的数据进行分析，并从中得出结论。
集体智慧:为了创造新的想法，而将一群人的行为，偏好或思想组合在一起。
学习型算法：市场预测，生物工艺学，金融欺诈侦测，机器视觉，产品市场化，供应链优化，股票市场分析，国家安全。

第2章提供推荐

欧几里德距离，皮尔逊相关度；
基于用户 Or 基于物品，进行分析过滤

第3章发现群组

数据聚类
监督学习和无监督学习；聚类属于无监督学习，其目的就是采集数据，找出不同的群组。
单词向量
分级聚类
绘制树状图

第4章搜索与排名

爬虫
建立索引
如何建爬虫库，已经过索引的URL列表，单词列表，单词在文档中位置的列表，，文档之间的链接信息，URLID表
加入索引
基于内容的排名，单词频度，文档位置，单词距离
归一化函数
利用外部回指链接，简单计数加权，PageRank算法0.85的阻尼因子，网页的重要性是依据指向该网页的所有其他网页的重要性，以及这些网页中所包含的链接数求得的。
利用链接文本

第5章优化

第6章文档过滤

第7章决策树建模

第8章构建价格模型