机器学习的平台化发展趋势

机器学习的平台化发展趋势

大数据 4周前 (12-23) 浏览: 612 评论: 0

文 | 张相於机器学习在经过近些年的野蛮生长之后,其有效性已经被无数成功应用所验证,在这一点上已经不需要更多证明。在使用方法和常用模型方面也已经没有什么太新奇的东西了。例如在模型方面,经过实践检验过的模型基本还是LR和GBDT,以及这两者的一些变种和结合,例如FM、LR+GBDT等等;再例如在特征处理方面,常用的包括离散化、归一化、平滑等等。学术界对这些方面的进一步改进,从效果上来说就像在从95分

如何像黑客那样玩转数据科学?

如何像黑客那样玩转数据科学?

大数据 2个月前 (11-17) 浏览: 651 评论: 0

作者 | Mikio Braun数据科学在过去几年在广泛的行业为人们所普遍接受。早期更多的是作为一项研究课题,数据科学源于科学家们为了探索人类的智慧和创造人工智能的不懈努力; 它已经证明,它可以增加真正的商业价值。

这个网站发布了互联网最早的一批动图

这个网站发布了互联网最早的一批动图

睿公司 3个月前 (10-29) 浏览: 313 评论: 0

快30年的图片格式GIF,其实是互联网上最初流行的图片格式。现在,你可以在网络档案馆Internet Archive找到最早的一批GIF动图。美国著名的非盈利性数字档案馆Internet Archive,最近上线了一个新的搜索引擎项目GifCities,把大量GIF图片从存储了大量早期网站的建站服务GeoCities(后来被雅虎收购后称为“雅虎地球村”)上抽了出来放了上去,大约有450万张。

飞林沙:企业级服务公司如何赚钱?只有平台级产品才有大数据的理论

飞林沙:企业级服务公司如何赚钱?只有平台级产品才有大数据的理论

大数据 11个月前 (02-16) 浏览: 181 评论: 0

文|飞林沙这篇本应在一周前产出的年底总结被拖延症拖到了现在,上午和同事去深大校园里逛了两个小时,看着学生们悠闲地背着书包走在去往自习室、图书馆的路上,不禁感叹原来自己已经毕业了六年时间。六年来,我从最初的Web开发人员接触到一些服务端开发,然后莫名其妙成为了业界最火热的大数据工程师、数据科学家。在职责上,从单枪匹马搞定所有事儿,到带领十几人的数据团队去做一个领域的探索,再到带领几十人的部门去做实验

当我们被数字吞噬:行为痕迹和智能生活

当我们被数字吞噬:行为痕迹和智能生活

大数据 12个月前 (01-26) 浏览: 298 评论: 0

作者:周学春这是一个被数字吞噬的时代。互联网大行其道、智能手机普及、智能硬件发展、存储技术进步、硬件成本下降,这些要素都推进了信息和数据爆炸性增长的趋势。2000年以前,人类仅存储大约12 EB的数据。但是,现如今,每天都将会产生大约2EB的数据。换言之,过去两年内人类社会的数据增长量占到全世界所有数据的百分之九十以上。数字不吞噬你,吞噬谁?

清华大学用大数据分析了9000条微博谣言,还在研究自动辟谣

清华大学用大数据分析了9000条微博谣言,还在研究自动辟谣

大数据 1年前 (2016-01-15) 浏览: 391 评论: 0

社交媒体上的谣言总是让人猝不及防,有些甚至能在短时间造成不小的危害。比如,几天前,微信怎么也不会想到,因为一个年终回顾的HTML5页面被提前泄露,带来大量用户点击导致服务器瘫痪,然后引发了盗号的谣言。最后的结果是,短短的几个小时内,数百万人从微信提现,解绑银行卡。

切换注册

登录

忘记密码 ?

切换登录

注册