博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
机器学习------精心总结
阅读量:5316 次
发布时间:2019-06-14

本文共 1735 字,大约阅读时间需要 5 分钟。

1.数学

  1. 偏差与方差
  2. 拉格朗日
  3. 核函数
  4. 凸优化
  5. 协方差矩阵
  6. Hessian矩阵
  7. CDF(累计分布函数)
  8. 高斯概率密度函数
  9. 中心极限定理

2.机器学习


1.处理小数据效果好

2.深度学习—大数据,超过500w;图像,语言方面效果奇好


  • SVD

  • 最小二乘法

  • 1.最大似然估计

    2.logistic回归
    3.感知器的初步—logistic的简化情节

  • 1.介绍了牛顿方法

    2.广义线性模型
    3.多项式分布,softmax回归

  • 1.高斯判别

    2.朴素贝叶斯

  • EM

  • 隐马尔可夫模型
  • 决策树向量机

  • K近邻
  • 支持向量机
  • PageRank
  • 强化学习
  • LDA
  • PCA
  • pLSA
  • LSI
  • ICA
  • 最大熵模型
  • 条件随机场
  • 最大熵隐马尔可夫模型
  • Gradient Boosting
  • K-Means
  • 贝叶斯逻辑斯蒂克回归
  • 关联规则挖掘
  • 随机森林

3.信息论

  1. 压缩率很高的数据结构
  2. 信息熵与信息增益
  3. 数据压缩原理
  4. 香农游戏
  5. 二维码原理

4.深度学习

机器学习的一个分支


  1. 感知器
  2. 反向传播算法
  3. 自动编码器
  4. 栈式自编码器
  5. 微调多层自编码算法
  6. 深度信息网络
  7. softmax回归
  8. 白化
  9. 池化
  10. 受限玻尔兹曼机
  11. 稀疏编码
  12. 递归神经网络
  13. 卷积神经网络—图像识别,语音识别,,.
  14. 前馈神经网络

5.全文检索

  1. 搜索建索引过程
  2. 搜索评分过程
  3. 搜索查询分析器
  4. Rocchio相关反馈算法
  5. 向量空间模型
  6. BM25基于概率的搜索评分
  7. Lucene源码分析
  8. solrcloud
  9. Solr空间搜索原理
  10. GeoHash算法
  11. 地理空间距离计算原理
  12. WAND检索算法
  13. 智能化信息检索模型
  14. Kullback-Leibler距离/相关熵
  15. 交叉熵

6.计算广告

  1. 正文广告
  2. 上下文广告
  3. 显示广告
  4. 合约广告
  5. 竞价广告
  6. 搜索广告
  7. 受众定向
  8. 竞价广告的定价机制
  9. eCPM估计
  10. 广义第二高价
  11. 精准人群定向
  12. 实时竞价
  13. 广告交易平台
  14. 需求方平台(DSP)程序购买
  15. 广告有效性原理
  16. 二部图匹配算法
  17. HWM算法
  18. 点击流挖掘
  19. 广告系统的一些商业模式
  20. 实时反作弊
  21. CTR点击预测
  22. 架构

7.自然语言处理



  1. N-gram语言模型
  2. 词共现/TFIDF
  3. 噪声信道模型
  4. 统计分类模型
  5. 语义相关性
  6. 基于HMM的词性标注
  7. 统计语言模型的评价方法
  8. 扩充转移网络
  9. 动态规划算法
  10. 最小编辑距离
  11. 浅层句法分析技术
  12. 知识库的构建
  13. 命名实体识别
  14. 未登陆词识别
  15. 语言模型结构设计
  16. 树邻近语法
  17. 文本建模
  18. 随机上下文无关文法
  19. 概率上下文文法
  20. 同义词自动构建(词共现,基于浅层语法分析)
  21. 文本分类技术

8.架构

  1. OOP
  2. 聊天系统/实时高效信息系统架构与源码
  3. Bloom Filter 过滤器
  4. 分布式时钟(逻辑时钟) 同步技术
  5. SCALA
  6. Netty
  7. Jetty
  8. 一致性Hash
  9. 分布式基本组建
  10. 原子广播

9.爬虫

  1. 爬虫原理
  2. 分布式架构
  3. 通用爬虫
  4. 主题爬虫
  5. Nutch
  6. Xpath
  7. 网页去重
  8. URL去重

10.应用

  1. 人脸识别
  2. 垃圾邮件分类
  3. 文本聚类
  4. 语音合成(分解)
  5. 语音识别
  6. 手写识别
  7. 推荐系统
  8. 文档主题分析
  9. 二进制权限系统
  10. 搜索引擎关键字智能提示
  11. 最小敏感局部hash算法
  12. Simrank
  13. 手写输入法
  14. 为文本生成关键词和摘要
  15. 拼音缩写提取
  16. 汉字转拼音/拼音转汉字
  17. 机器翻译
  18. 自动提取标签
  19. 图片提取标题
  20. 文字生成图像
  21. 问答系统

11.Github中的开源项目


1. Github:

2.
Github:
3.
Github:
4.
5.
6.
Github:
7.
8.
9.
10.CUDA-convnet
11.
Github:

12.个人收集网址

  • 台湾机器学习课程

13.机器学习需要了解的人物

1.

2.中国大牛组

  • 周志华
  • 杨强
  • 李建中 —分布式数据库
  • 唐杰 —图挖掘
  • 张钹
  • 刘铁岩
  • 王海峰 —信息检索,NPL,机器翻译
  • 何晓飞 — 多媒体处理,图像检索,流型学习
  • 朱军
  • 吴军
  • 张栋
  • 戴文渊
  • 李航—华为诺亚方舟实验室

《中国大牛组》资源来源于小木虫


14.会议论文收集

15.书籍

1.PRML—Pattern Recognition And Machine Learning

转载于:https://www.cnblogs.com/hellochennan/p/5424162.html

你可能感兴趣的文章
[Swift]LeetCode1146. 快照数组 | Snapshot Array
查看>>
检查点(Checkpoint)过程如何处理未提交的事务
查看>>
IT行业 侃侃富士康
查看>>
Windows按名称排序问题
查看>>
python 生成排列、组合以及选择
查看>>
myeclipse和maven的clean和build
查看>>
SpringMVC接受JSON参数详解及常见错误总结我改
查看>>
JS里的onclick事件
查看>>
Echart..js插件渲染报错 data.length<1?
查看>>
js闭包
查看>>
06 小数据池 is 和 = = 再谈编码
查看>>
NSValue包装自定义结构体
查看>>
mac下npm/node的安装和卸载、升级;node、npm升级后最后删掉node_modules重新安装
查看>>
wget整站抓取、网站抓取功能;下载整个网站;下载网站到本地
查看>>
MATLAB数值计算与符号运算
查看>>
杭电Acm刷题顺序
查看>>
在php中使用sockets:从新闻组中获取文章
查看>>
UILabel的高度自适应
查看>>
php基础-1
查看>>
内测投票
查看>>