Skip to content

sulimin-nb/school-of-ai-beijing

 
 

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

GitHub stars GitHub forks GitHub issues GitHub release GitHub license


<script type="text/javascript" src="//rf.revolvermaps.com/0/0/1.js?i=5ccx59t5xwh&s=350&m=7&v=true&r=false&b=000000&n=false&c=ff0000" async="async"></script>

如果在你浏览的是github里的readme文件,无法查看视频,请点击The School of AI Beijing

目录


关于SoAI-About The School of AI

logo

  • An international educational non-profit platform dedicated to studying, teaching and creating AI to help solve the world’s most difficult problems. Our mission is to offer a world-class AI education to anyone on Earth for free.
  • Siraj对SoAI的介绍
<iframe src="//player.bilibili.com/player.html?aid=37767979&cid=66394634&page=1" scrolling="no" border="0" frameborder="no" framespacing="0" allowfullscreen="true" height="600" width="100%"> </iframe>
  • 北京分部有中文、英文两个版本,详情:
    • 英语分支,每周一晚在朝阳,Max主讲,github en
    • 中文分支,每周末下午17:00,清华大学,海淀区双清路双清大厦4号楼4层清华数据科学研究院,王奇文等主讲,采用翻转课堂方式 first,flipped

SoAI-北京

Fast.AI

开发环境-Dev environment

  • 多种方式:本地、云环境,由于不少项目需要GPU支持,建议采用云环境

本地环境-Local env

  • 为什么大家都用jupyter notebook?深度学习代码只能在notebook上跑吗?
  • 非也,notebook主要用于教学展示,代码分享,工程落地时,必须转成单个的python文件,按照机器学习的基本流程划分文件及目录,常见的结构如下:
    • data:数据目录,包含:
      • train.txt
      • test.txt
      • validation.txt(可选)
    • bin:核心代码,主要包含:
      • model.py:模型定义
      • feature.py:特征工程部分,离线训练和在线评估都有
      • train.py:模型训练代码
      • predict.py:在线预测(inference,推断)
    • model:模型存放
    • log:日志目录
      • 训练日志,如tensorboard日志
    • conf:配置文件
    • common:公共库、组件
      • eva.py:效果评估

云环境-Cloud env

学习资料-Learning material

入门必读-Must read for beginners

课程列表-Syllabus

Fast.AI系列速成实战课程,时间安排如下:

  • 注意:这是github page搭建的主页,如想进入github,请点击“View on Github”,示例如下:
  • 历次ppt课件资源
时间-Date 章节-Chapter 题目-Topic 预习资源-Resources 正式解读-Interpretation 作业-Homework
2019-04-21 介绍 深度学习入门指南 请完成ppt里提到的作业,长期 这节课长达2h,内容非常多,覆盖深度学习入门几乎全部知识点 完整看完80+页的ppt,并预习第二课
2018-04-27 第一课 宠物图片分类,英文视频,中文版笔记 Github代码 安装fastai环境并动手实现,代码解析:Github本地,Colab,Kaggle 亲手执行本次代码,熟悉fastai环境
2018-05-12 第二课 特征工程及SGD,英文视频,中文版笔记 Github代码 github,colab,kaggle示例 ①熟悉fastai+kaggle环境②执行scikit-learn代码,github库里,code/lecture_2目录下 ③学完google机器学习速成课速成课(地址见本页面的入门必读) ④预习神经网络fastai第五课-反向传播与神经网络
2018-05-* 第三课 多标签分类,英文视频,中文版笔记 Github代码 - 作业
2018-05-* 第四课 NLP&推荐系统,英文视频,中文版笔记 Github代码 - 作业
2018-05-* 第五课 从反向传播到神经网络,英文视频,中文版笔记 Github代码 github代码,ppt 作业
2018-05-* 第六课 正则化卷积,英文视频,中文版笔记 Github代码 - 作业
2018-05-* 第七课 Resnets、GAN等,英文视频,中文版笔记 Github代码 - 作业
- - - - - -

最新课程安排见project区Fastai中文笔记kaggle中文代码

课程内容-Contents

  • 本教程以fastai的速成课为蓝本(注意:需要vpn,如果没有,请往下看,找bilibili上的视频) fastai
  • 如有问题,可以去SoAI论坛提问

第一课 深度学习入门指南-Intro to Deep Learning

  • 深度学习入门全貌,请仔细看

第二课 图像分类-Image Classification

  • 主题:fastai课程的第一课进行讨论:图像分类。
  • 时间:于4月27日星期日下午5点举行
  • 地点:双清路77号院双清大厦4号楼4层清华数据科学研究院

议程:

  • 介绍fastai第1课的必要资源,如何获取fastai的资源
  • 学生现场演示第一课作业
  • 自由问答, 遇到困难

视频资料:(来自哔哩哔哩

  • <iframe src="//player.bilibili.com/player.html?aid=46252318&cid=81036516&page=1" scrolling="no" border="0" frameborder="no" framespacing="0" allowfullscreen="true" height="600" width="100%"> </iframe>

作业汇总-Homework Summary

参考资料-References

CNN和CV

  1. iris数据集+机器学习实战

  2. CNN简介

  3. 应用

  4. 反思

结业答辩-Graduation presentations

介绍 Introduction

  • 时间:2019-06-16
  • 中文分支的往期内容及课件,见地址
  • 答辩现场,由于学员较多,时间长,从16:00-19:40,衷心感谢各位坚持到最后 image image

中文分支 Chinese branch

  • 第一位 邢畅, xingchang, 16:07,学习总结,在地理信息系统里的应用
    • 介绍了GIS领域的应用,整理了详细的学习笔记、脑图
  • 第二位 张天奇,Tianqi.Zhang,16:27,kaggle比赛,基于新闻语料的股价涨跌预测,Eric Zhang
    • 成绩:356/2800, ≈13%,4个人的团队,负责特征工程+多线程实现,xgboost主要负责分类
    • 提问:
      • xGBoost的原理,既可以用于分类,还可以用于回归
      • 代码里将的metric用的是MSE,而xgb导入的是分类器,看似矛盾?
  • 第三位 五个人,推荐资料:数学基础张宇36讲,课程内容回顾;
    • 蒋宝尚,mnist的python实现,文本分析(大爆炸+华为+五月天)
    • 周启红,学术文章关键词提取,学习过程中遇到的坑儿
    • 王瑞华,视频汇报
  • 第四位 黄安付,17:15,专题报告:fit_one_cycle()详解
  • 第五位 李靖华,17:36,学习总结
    • git,学习方法总结
    • 实习经历,4w张图片分类,用代码1天完成,做事情时先别急着动手
    • 成功拿到创新工场的实习机会,新人到职场的华丽蜕变
  • 总结
    • 答辩里的几个技术点可以继续深挖:
      • ①sgd各种算法演化,动量和梯度分别对应哪一块?这道题是新手的进阶题,打怪升级的典型门槛
      • ②kaggle项目里的矛盾点要必要澄清下,基于新闻预测股价,为什么用xgb分类?特征工程部分可以继续系统化,不满足于简单的数据处理
      • ③实习经历里的4w张图像标注任务可以补充描述下,说不定有更好的办法

英文分支 English branch

资料汇总-Resources

  • 部分学员的答辩整理已收集到目录, 欢迎大家积极分享自己的资料,共同学习,添加方式,回复本帖
  • Part of the resources have been collected to this address, it's recommended to share your own ppt/code/post here by reply bellow, learn from each other
  • 大部分基础知识以及扩展资料都在之前的课程ppt中,多看SoAI主页The School of AI Beijing毕业了并不代表学完了,或者真的学好了,请大家有空多温习,少走弯路

交流分享-Share

欢迎大家入群分享、交流!

合作方-Partners

  • 大数据文摘+清华数据科学院研究院

bdd

  • 举办地点:清华大学
  • 时间:每周末一次,如想参加,请先文摘助手微信,往期海报如下:

bdd


<iframe src="https://ghbtns.com/github-btn.html?user=wqw547243068&repo=school-of-ai-beijing&type=watch&count=true&size=large" allowtransparency="true" frameborder="0" scrolling="0" width="156px" height="30px"></iframe> <iframe src="https://ghbtns.com/github-btn.html?user=wqw547243068&repo=school-of-ai-beijing&type=fork&count=true&size=large" allowtransparency="true" frameborder="0" scrolling="0" width="156px" height="30px"></iframe> --- <script type="text/javascript" src="//rf.revolvermaps.com/0/0/1.js?i=5ccx59t5xwh&s=350&m=7&v=true&r=false&b=000000&n=false&c=ff0000" async="async"></script> --- <script> var _hmt = _hmt || []; (function() { var hm = document.createElement("script"); hm.src = "https://hm.baidu.com/hm.js?1da5e6aa58efde9ff55242aece940f6a"; var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(hm, s); })(); </script> --- <script async src="https://www.googletagmanager.com/gtag/js?id=UA-139247575-2"></script> <script> window.dataLayer = window.dataLayer || []; function gtag(){dataLayer.push(arguments);} gtag('js', new Date()); gtag('config', 'UA-139247575-2'); </script> ---

Releases

No releases published

Packages

No packages published

Languages

  • Jupyter Notebook 100.0%