集体智慧编程

第1章 集体智慧导言
  • 解释蕴藏于机器学习背后的概念,解释如何将其应用于诸多不同的领域。以及如何利用它对 搜集自许多不同人群的数据进行分析,并从中得出结论。

  • 集体智慧:为了创造新的想法,而将一群人的行为,偏好或思想组合在一起。
  • 学习型算法:市场预测,生物工艺学,金融欺诈侦测,机器视觉,产品市场化,供应链优化, 股票市场分析,国家安全。
第2章 提供推荐
  • 欧几里德距离,皮尔逊相关度;
  • 基于用户 Or 基于物品,进行分析过滤
第3章 发现群组
  • 数据聚类
  • 监督学习和无监督学习;聚类属于无监督学习,其目的就是采集数据,找出不同的群组。
  • 单词向量
  • 分级聚类
  • 绘制树状图
第4章 搜索与排名
  • 爬虫
  • 建立索引
  • 如何建爬虫库,已经过索引的URL列表,单词列表,单词在文档中位置的列表,,文档之间的链接信息,URLID表
  • 加入索引
  • 基于内容的排名,单词频度,文档位置,单词距离
  • 归一化函数
  • 利用外部回指链接,简单计数加权,PageRank算法0.85的阻尼因子,网页的重要性是 依据指向该网页的所有其他网页的重要性,以及这些网页中所包含的链接数求得的。
  • 利用链接文本

第5章 优化
第6章 文档过滤
第7章 决策树建模
第8章 构建价格模型