夜航船夫

记一次数据科学沙龙

机缘巧合,参加了第一次由统计之都联合其他单位在宁波办的数据科学沙龙。沙龙请了两位大咖,一位讲数据科学的发展及应用,一位讲具体的开发工具。简单记录了一下。

数据科学的发展变迁及行业应用实例

嘉宾:李舰

发展历史

医疗健康应用

商业零售应用

工业制造应用

交通物流应用

问:相关性和因果性如何区分?
答:大数据只研究相关性,不研究因果性。用对方法,相关性强,接近于因果性。

茶歇时刻,大咖聊起大数据应用的前景说,最看好的还是工业制造方面的应用,因为这是最容易改进出较大经济效益且还处于红海阶段的领域。

Python机器学习生态

嘉宾:肖凯

项目成功四点因素

岗位:数据分析师(报告)、数据科学家(原型代码)、程序员(代码)

Python的工具集

ml_map

TensorFlow官网有一个神经网络游乐场,可以玩一下。

问:树和神经网络应用如何选择?
答:神经网络可以分析图、无人工特征的数据,速度慢一些。树可用于结构化数据,已经经过人工筛选的数据,速度快。


最后,推荐一位统计之都核心成员的独立博客:谢益辉,可以用RSS订阅。虽然是统计学博士,文章很有人文气息。

— 于 共写了1211个字
— 文内使用到的标签: