机器学习

Co-China周刊 | 《纽约时报》:柏林墙要倒了!(译言网)

欢迎来到全新的“大型公开网络课程”( MOOCs )的世界,他它是高等教育民主化的工具。数十年来,理论上讲,免费的网络课程蕴含的巨大潜力激起了大家的兴趣,但事实上,过去的几个月时间,世界各地成千上万的积极进取的学子们,由于没机会读大学,他们把网络课程视为学习高端技术还有获得高薪工作的捷径,而他们不用交学费或获得大学学位认可。于此同时,某种程度上一些人视网络课堂是传统高校的威胁。现在的某些课程有些是颁发非正式的证书的(大多数情况下,这些课程是收费的。)     在线课程的极力宣传就像深夜播放的电视广告,或地铁里张贴的海报:“7周的编程学习将从2月20号开始,我们将传授给大家充分的计算机科学知识,也让你设计出如谷歌或雅虎那样的搜索引擎来。” 这堂“创建搜索引擎”的课由两位著名的计算机科学家执教,一位是斯坦福大学的教授兼谷歌工程师巴斯蒂安·特龙,另外一位是弗吉尼亚大学在休假当中的教授大卫.埃文斯(David Evans)。 这些赫赫有名的人物是课程的一大亮点啊。自Udacity网络课程后,盈利机构启动了现有课程,1月23号注册的,就有9万多学生报了搜索引擎课程,还有另外一门特龙先生教授的,他还领导谷歌的租赁汽车的开发。 欢迎来到全新的“大型公开网络课程”(MOOCs)的世界他,它是高等教育民主化的工具。数十年来,理论上讲,免费的网络课程蕴含的巨大潜力激起了大家的兴趣,但事实上,过去的几个月时间,世界各地成千上万的积极进取的学子们,由于没机会读大学,他们把网络课程视为学习高端技术还有获得高薪工作的捷径,而他们不用交学费或获得大学学位认可。于此同时,某种程度上一些人视网络课堂是传统高校的威胁。现在的某些课程有些是颁发非正式的证书的(大多数情况下,这些课程是收费的。) 考虑一下斯坦福的遭遇:去年秋天,190个国家的16万学生报了由特龙还有他谷歌的一同事诺维格(Norvig )合开的“人工智能”课。此外还有200人在校园里选了这门课,但开学不到几周时间,斯坦福大学的出勤人数就少了约30人。因为一些同学有了双向选择,比起亲子见教授们听课,他们更倾向于网络视频教学,手里拿支笔,问题就得以解决了,就这么简单。 对网络课程的规模特龙先生狂喜不已,目前课程孕育出自己的文化内涵了,其中包括Facebook的组织,在线讨论以及大群的自愿者翻译们,他们将课程译成了44种语言。 “做了这一块,我就没法在斯坦福任教了。”特龙教授1月份在德国的一场数字会议上表示。“我觉得就好像有两种药丸,一种是红的,一种是蓝的。你吃了蓝色药丸,就能回到斯坦福的教室课堂上给我的20位同学讲课。但我吃的是红色的那个,我同样看到了仙境。” 除“人工智能”课外,斯坦福大学还开设了MOOCs的其它两门课—一是“机器学习”(104000人注册,13000人完成该课程),还有一门“数据库介绍”(92000人注册,7000人完成该课程学习)。春季学期斯坦福有13门课程是向世界开放的,包括解剖学,密码学,游戏理论和自然语言处理。 “我们的网络课程仍在完全试验阶段,我们也正在考虑努力沿着这条路走下去的方法。”斯坦福大学教务长约翰. 艾许曼蒂(John Etchemendy)表示。“我们责任就是教育,世界范围内能够让更多人接受教育的任何做法我是全力支持的。但是还有一些问题必须考虑,一是版权问题,再者如果颁给接受网络课程教育的学生人为的证书,并且冠以斯坦福大学的牌子的话,这对我们资格鉴定又将产生怎样的影响。” 特龙先生就通过电子邮件的形式发给了完成人工智能课程的学生一个PDF文件,标明了他们的百分制得分,但是没有以斯坦福大学的名义,248名学生(不是斯坦福的)取得了百分比的分手。 对很多早期的网教狂热者来讲,网教公开承认目标是改变世界而非仅仅是赚钱。但Udemy网教课程(受益于团购网创始人的支持)开办以来却希望用户广泛使用该网站最终获利。而特龙先生在查尔斯河公司支持下成立的的新网教公司Udacity,从本质上讲,也正计划从学生的技能增长中(如帮他们找到工作)敛财了。 “我们也将对学有所成的数以千计的学生进行详细的记录,他们有很多希望自己所学受未来老板赏识。”弗吉尼亚大学教授埃文斯表示。“如果一名招聘人员想从100位候选人当中挑出在地理和机械领域都有所造诣的最佳人选的话,我们就能造就这样的人才,但是要收点钱的。我认为这是一场革命的开端。” 2月13号,麻省理工学院正在推出它的未来10年的在线课程资源,也公开注册了首个MOOC网络课程—电路电子课程。这节课将成为麻省理工学院项目的原型,它终将推出大范围的课程,还为完成这些课程的学子们颁发某种证书。 乔治亚理工学院也试验性地开设了两学期的名为“改变11”( Change 11 )的大型公开网络课程,课程是以自由活动论坛形式呈现的,多是学生间的问题发布解答之类,而非以教授轮流布置正式学习资料的形式—只有两门课程将得到学院的学分。明年,乔治亚理工学院“21世纪大学”实验中心主任理查德.迪米罗希望通过各个大学的网络整合一个大型的公开网络研讨班,并且可以提供学生学分。 网络课堂平台 Udemy 目前宣布其推出了新网教课堂“教员工程”(Faculty Project),一些享有声望的教授们(如英国达特茅斯大学的,美国弗吉尼亚大学的还有西北大学的)提供免费网络课程。网站合伙人葛根.比亚尼表示已经有10万多学生注册了课程,还有几门项目外的收费课程。 专家表示有几个原因把MOOCs网教推向了教育舞台的中央,包括科技的日新月异,还有传统大学天价的花费。 “现在我们已经有了以盈利为目标学院的先例,表明了我们进军大型网络课程是极有可能的。”独立政策学院,教育部政策主任凯文.凯里表示。 五年前,乔治·西门子(George Siemens)创办了MOOC,为公开教育开了先河,网络教授麻省理工学院所教授的课件,这一下子吸引了23000名人参与,还把课程大纲译成了几种语言。身为阿色巴斯卡大学(加拿大公费支持的网教机构)教授,西门子表示,大型公开网教模式已经开创了别开生面的社交网络,这点很清晰了,同学们可以自发地在网络平台上广泛地经行讨论。 “很多同学通过第一节课和其它同学形成的关系都持续到现在了。”身兼乔治亚理工大学项目推进者的西门子先生表示“我们发现在网教平台上,不再以教室为中心了,这个平台反而成了社交关系的集合点。” 目前的技术支持更加集中的MOOCs网教平台高度自动化了,有电脑打分的专业和考试。但社交空间仍很充足。例如斯坦福的MOOCs网教课程就包括虚拟办公室时间和在线讨论论坛,在那块学生可以互相提问和解答问题,并且表决——那点太重要了,需要听听教授的意见。 “课堂上,你如果问个问题,由一个同学回答,其它人就没有机会了。”特龙先生表示。“在线网教课程拥有嵌入式的小测验,人人都能试着回答问题。如果他们理解不了,他们能回过头去一遍遍听课程直到听懂为止。”就像一个小孩学骑自行车摔倒了,你不能打击他说“你得了D太差劲了,”你应该鼓励他不断去尝试,他表示网络课堂里学生们可以按照自己的节奏学习,能帮助他们不断练习直到完全掌握内容。“我们的目标应该让每个学生达到A+的水平。” 上学期特龙先生课程的几个学生是通过电子邮件和他保持联系的。MOOCs工作人员透露说。 Balakrishnan Srinivasan,45岁,班加罗尔(印度南部城市)的工程师,表示他经常重复看课件视频,他感觉“有了私人家教似的”。他的人工智能课得了94.8分,并且他已经选了Udacity网络课程的两门课。 Brian Guan,44岁,出生在马来西亚的软件工程师,现居加州帕洛阿尔托(译者注:美国旧金山附近城市)。在一次邮件采访中,他展望了一幅乌托邦的画面:“我希望,这种使用毫无无限制,绝对自由风格的学习方式可以提高全人类的知识文化水平。”   (TAMAR LEWIN,纽约时报记者。译者janet985。转载自译言网。原文链接: http://select.yeeyan.org/view/288434/258560 )

阅读更多

译者 | 卡内基梅隆针对中国社交媒体上的“软审查”开展首次大规模分析

核心提示:卡内基梅隆大学(以下简称CMU)计算机系的研究者们分析了5700万条中国的微博,发现敏感词从”法轮功”到”碘盐”不一而足。删除的频率则根据当前时事和地理位置的变化,强度也有不同。 原文: Carnegie Mellon Performs First Large-Scale Analysis Of “Soft” Censorship of Social Media in China 来源:卡内基梅隆大学计算机系新闻简报 发表:2012年3月7日 本文由” 译者 “志愿者翻译并校对 【原文配图:全国范围内的网络审查。越红的地方审查力图越大。最严重的是西藏地区,高达53%的当地微博被删除。】 匹兹堡—— 卡内基梅隆大学(以下简称CMU)计算机系的研究者们分析了数百万条中国的微博,发现了一系列政治上敏感的短语,这些会引起中国的审查系统的注意。一旦博文中包括这些短语,通常都会被删除,删除的频率是基于当前热点或地理位置。 这一研究是首次大规模针对社交媒体上的政治内容审查进行的分析。今年早些时候,当推特(Twitter)宣布会按照国别政策删除不符合当地法律法规的推文时,这个议题引起了注意和争论。 在中国,在线审查高度发达,研究者们发现经常被删除的短语包括广为人知的禁词,比如法轮功,这是一个由中国政府禁止的教派运动,还有人权活动家艾未未和刘晓波。其他的禁词则是基于当前事件;在2011年2月期间,当两会成为指称”计划中的抗议”的暗语时,这个本来是指全国人民代表大会和政治协商会议的词成为了删除对象。 CMU的研究也展示出在某些省份微博的审查频率更高。这一现象在西藏尤其引人注目,西藏是政治抗议的温床,高达53%的当地微博被删除。 由语言技术学院(LTI)的助理教授诺兰·斯密斯(Noah Smith)、LTI的博士候选人大卫·巴曼(David Bamman)和机器学习系的博士候选人卜兰丹·康纳(Brendan O'Connor)联合这项研究的发表于同行审校的在线杂志《首个星期一》(论文 原文全文 )。 所谓的”防火长城”可以阻止中国居民登陆如谷歌和Facebook这样的外国网站,这是中国最广为人知的审查工具。其他的国家也会屏蔽网络,比如在去年阿拉伯之春抗议爆发时,埃及就曾经关闭过推特和其他的社交媒体网站。 巴曼说,但是中国或任何其他国家如果想要从网上交易或在线教育中受益的话,关闭所有网站是不可能的。替代的方式就是允许登陆网站,但是审查内容,去除那些被认为有害的信息。他还说,可以采用自动方式来删除一些信息,其余的则通过人工删除。带有敏感词的所有微博被删除的情况不常见,但某些特定的词语成为删除的对象,所发现的零散证据令人吃惊。 康纳说:”你会看到在某些微博中,博主甚至会问,’这会被删除吗?'”2010年年末,纽约时报的专栏作家纪思道(Nicholas Kristof)在中国的(新浪)微博网站上开了一个账号;在他发了一条关于法轮功的消息之后一小时之内,他的帐号被关闭了。 CMU的团队为了研究这种”软”审查,分析了新浪微博上将近5700万条消息,这是一个有超过2亿账号的类似于推特的中文网站。从2011年6月27日号-9月30号,他们用新浪微博提供给开发者的一个应用程序软件(API)来收集样本。 他们后来使用同样的API,以随机的方式检查了部分微博,查看它们是否被删除了,然后再取另一部分包括了已知的敏感词的微博进行测试。如果这条微博被删除,新浪则会回复给开发者一条信息:该微博已不存在。 举例来说,在6月底和7月初的时候,网络上开始流传江泽民的死讯,他是在1989年天安门抗议之后掌握权力的中共前总书记。在七月六日,传言达到了高峰,83条带有他的名字的信息当中有64条被删除,在七月七日,31条这样的信息中有29条被删除。 研究者们又作了一项调查,把新浪微博上的消息和推特上的中文消息进行对比,后者虽然在中国被屏蔽了,但还是有精通网络的用户能登录。七月六日,每75条推文中就会出现一次江泽民的名字,但在新浪微博上,5666条微博中才会出现一条——这是另一个证据说明在新浪微博上,关于江泽民的讨论被压制了。 经常被删除的许多微博包括了政治敏感的短语和名字,比如设计”防火长城”的方滨兴,以及提到中宣部的博文。其他的则体现出事件的敏感性,在去年七月温州动车事故造成40人死亡,之后”请辞”成为了删除对象,这明显指的是铁道部部长。 被删除的词语并非总是政治性的。2011年三月,日本福岛核灾难发生之后,政治上不敏感的短语,如碘盐和辐射强度都被大量删除。研究者们相信这是因为政府想要遏制谣言,不希望核事故导致囤积盐的行为。 研究者们注意到,不是所有的删除都遵照国家的审查机器指示,垃圾消息和色情信息都是删除的对象,这和美国一样。 研究者们建立起了研究中国的软审查的方法,他们说现在他们有了这样一个工具可以积极地观察社交媒体的审查如何随时间演变,他们同时也有方法可以让调查更深入了,比如找出那些用来规避审查机器的暗语和的隐喻。 相关阅读: 一位个人研究者公布的 中国微博上被屏蔽的378个”敏感词” 点击这里阅读更多和” 防火长城 “相关的译文 本文版权属于原出版公司及作者所有。©译者遵守 知识共享署名-非商业性使用-相同方式共享 3.0许可协议 。   译文遵循 CC3.0 版权标准。转载务必标明链接和“转自译者”。不得用于商业目的。发送邮件至 yyyyiiii+subscribe@googlegroups.com 即可订阅译文;到iTunes 中搜索“译者”即可订阅和下载译者Podcast;点击 这里 可以播放和下载所有译者已公开的视频、音频和杂志。(需翻墙)。

阅读更多

GFW的前世今生,一部GFW之父方滨兴的发家史

标题的GFW之所以加上引号是因为,GFW是局外人起的绰号,它的真实称呼并非如此,但”GFW”也确实如实涵盖了这一在中国一贯隐晦而模糊的概念。 时间表 – 1998年9月22日,公安部部长办公会议通过研究,决定在全国公安机关开展全国公安工作信息化工程――”金盾工程”建设。 – 1999年4月20日,公安部向国家计委送交金盾工程立项报告和金盾工程项目建议书。 –...

阅读更多

Google在中国的悲催历史

Google在2000年代急速发展,中国也是一样。中国是这个时代最激动人心的商业故事。这个曾经封闭的红色巨人不仅仅是在经济上天翻地覆,而且它的人民,那些在奋斗中成长起来的人们开始品尝到经济建设的果实。      2004年1月Google内部的一份资料宣称:“中国对于Google有重要的战略意义。“ ,这个国家大到无法忽略。”拉里和谢尔盖都对被挡在中国的大门外感到沮丧,我们不能忽视那十几亿的用户群,“ 安德鲁,迈克拉林[1]说,他2004年作为策略主管加入Google。迈克拉林对和中国打交道有一些经验,他曾帮助一些非赢利组织获准提供信息服务。      2004年春天迈克拉林带了一个小型的代表团来到中国,他为此承担的数次旅行中的第一次。“那次有点像是一次侦察行动,”      迈克拉林在公司会上展示了他的中国之行的收获,收益和风险都列了出来 — 他始终担心和官方打交道的风险。所有人都同意Google应该在中国事务上投入更多的精力。施密特要求迈克拉林进行一次伦理上的分析。迈克拉林对施密特的要求记得非常清晰:“别去想收入,假设商业利益的得失毫无影响,然后去得出最佳的分析结果:到底是Google进入中国能加速它的变化,促进信息流动,还是Google留在中国之外更能起到这样的作用?这就我要问的问题。”      迈克拉林为这份报告工作了整一年,每六个星期就在中国呆一周。有时候他把拉里和谢尔盖来来一起讨论中。一次这三个Google人和萧强[5]会面,萧强是一个在伯克利执教的中国人。他告诉佩奇和布林:如果他是在对绝大多数别的公司提出建议 — 比如说是一家汽车公司,他会劝他们不要去中国,在那里展开生意未必是好事。但是互联网不同。中国的民众希望提升交流水平,而互联网可以帮助他们。   

阅读更多

人民搜索资源“硬”:员工可获北京户口

人民搜索今日启动新一轮校园招聘,职位为研发工程师。据称被录用者将享受具有市场竞争力的薪酬福利待遇,还可解决北京户口。此外,人民搜索也在吸纳互联网领域技术精英加盟。   据悉,此次招聘定向为全国高校计算机专业应届毕业生。应聘者需具有计算机相关专业本科以上学历,有C++/Java编程经验,了解数据结构和算法,有自然语言处理、数据挖掘、机器学习等相关实习或工作经历。   本轮招聘截至3月15日,初选合格者即进入笔试、面试程序。   人民搜索的掌门人邓亚萍表示,“互联网是一个技术的海洋,我们期待中国最优秀的青年学子和工程师加盟”。人民搜索首席科学家刘骏也表示,“我们将用两、三年时间,将人民搜索打造成为技术实力最强的中国互联网企业之一”。   在大规模招聘应届毕业生的同时,人民搜索也在广泛吸纳互联网领域的技术精英加盟。具体招聘信息可登陆 www.goso.cn 查阅。   (来源:新浪) MSN空间完美搬家到新浪博客!

阅读更多