文娱救世主全文阅读-第161节-TXT图书下载网(www.bookshuku.org)

盖棺定论了。

    所谓“神经网络式算法”，库克教授十几年前就有涉猎，相比于8年代以来的其他“np穷尽理论”而言，其最大的特点是“没有运算核心”。

    用人体来举例，人作为一个生物个体而言，是有中枢神经的——绝大多数机体行动，都是大脑控制肢体，眼口耳鼻手足感知到了外部信号之后先要通过反射弧传递到大脑（部分最低级的反射，至少也要到延髓/脊髓处理）等大脑作出处理指令之后，手足才会作出反应。

    但是如果把大脑单独作为一个独立个体解剖开来看，大脑内部上千亿个神经元是平等的。并不存在“某一撮神经元高于其他周边神经元、从而在处理信息时先由这一撮神经元预处理、预处理完之后再交给下一撮神经元处理”这样的先后顺序。

    （神经网络当然还有其他很多基础特点，这里仅仅讨论和“遗传算法/退火算法”的主要区别，所以不多赘述了。否则能水几万字，大家还看不懂。）

    当年“神经网络”的概念被提出时，就是为了探讨一种让电脑高效处理类似于“找到礼堂里到底有没有我认识的人”问题的新方法：如果可以有多个电脑，自然随机地分配任务，并行从多个点开始用就近算法寻找，那么自然可以在“单核cp”性能比较弱的情况下，通过堆砌cp数量加快问题的解决度。

    但这个概念并没有“节约计算资源”，因为理论上它只是把“台电脑时工作量”变成了“台电脑时的工作量”而已。而且这种最原始的“神经网络”也依然没法解决那些“似是而非”的模糊问题——他们只能回答“有我认识的人/没有我认识的人”这种非此即彼的问题。

    库克点名了在这个领域让顾诚对其应用模型出个子丑寅卯来，顾诚自然不能避战。

    “我拜读过辛顿教授对于神经网络的最新模型假，卷积神经网络，以及与之配套的学习型算法。我认为这个东西可以和互联网的自动识别/索引工具相结合。至于具体的应用场景么……那就属于商业机密了，恕我无可奉告。”

    “卷积神经网络的新用法？”

    史蒂芬库克教授一愣，但很快冷静下来，他可不是一个概念就能忽悠住的。

    “看来，顾先生要论述的重点，就在于‘卷积’上面了？”

    “没错，如果没有‘卷积’，仅有‘神经网络’，我们依然没法讨论近似于人脑判断的模糊问题。”顾诚一副成竹在胸的样子，似乎对对方的反应早有预判。

    他打开电脑，接上投影仪，屏幕上出现了一张猫的图片。

    “我用图上这只猫举例子——尽管这只猫一只耳朵竖着一只耳朵折了，眼珠瞳孔也有点不正常，尾巴还特别短，毛色肮脏还和照片的背景色非常接近，但我作为一个人类，还是一眼就认出了这确实是一只猫。

    现在，我用我根据辛顿教授的阀值思想编写的自学程序，用机器对这只猫是否是猫进行初次预判。在这个算法里，我们预构了3个组合特征量，比如‘猫眼’、‘猫耳’‘猫毛’、‘猫尾’……然后用三十个神经元单位的处理资源，分别针对每一个组合特征量进行预判，然后分别给出结果。

    在这三十个神经元单位内部，我们再根据‘本图猫眼与本神经元见过的猫眼’之间的像素相似度作出判断，给出一个积值，从而得到‘这有85概率是一只猫眼’或者‘有7概率是一只猫耳’之类的参考量。最后，把这3个组合特征量按照默认：的权重进行组合，最终平均分高于6分就判定‘这是一只猫’。”

    “那成功率肯定很可怜。”库克教授耸耸肩，一脸的悲悯。

    “当然很可怜，因为我的实验才开始呢——做到这一步，并不是要让机器判断正确，而是在机器判断完之后，让人眼再复查一遍。如果机器和人的判断结果一致，那么就给目前的特征量分组方式和每个特征量的权重比例数组加分。

    然后，再判断下一次。如果还对，再加一分。直到判断错了，然后就自动对现有权重比例数组作出调整：比如，此前判断正确的两次‘平均分6分’的结果中，‘猫眼’得分分别是75和8分，而‘猫耳’得分是45和4分。而判断错误的那一次‘平均分6分’的结果中，‘猫眼’是5分‘猫耳’是7分。那么，我们就可以得出一个结论：决定猫是否长得像猫的所有特征变量中，‘猫眼’是比‘猫耳’更关键的变量，在计算综合分的时候应该提升其权重。

    最后，按照这个逻辑让这套算法看一百张猫图，一千张，一万张……算法自然会总结出一套‘即使不全对，但正确概率越来越高的判断权重’。”

    人类的孩儿，在3岁的时候学习认各种东西，其实大脑里就是这么算的。没什么非坚持不可的特征，看个几百只猫，自然而然就调整各个特征权重，知道什么是猫了。

    没有任何一个变量，拥有“一票否决”的权力。充其量，只是其在卷积神经网络中的“积分量”比较高而已。正是因为如此，人类才可以在看到一只双眼彻底被挖掉的猫时，依然认出这是一只猫。

    ……

    顾诚的整体论述，自然是非常冗长的，难以一一赘述。

    其中很多关窍，透了之后也完全通俗易懂，根本没什么逼格。

    但是顾诚至少为“如果做不到全对，就没有商业价值”的卷积神经网络，提供了一种“就算现在做得还不太好，也能在一两年内就取得阶段性商业变现可能性”的路径。

    史蒂芬库克教授与之交谈良久，最后默然不知如何应对。

    “神圣的神经网络算法研究，居然用这种毫不严谨毫不科学的推论、假设、模拟来解释。这些想法和推论根本没法形成论文和成果体系。”库克教授本能地抨击了几句，但是冷静下来之后，一咬牙，不得不承认，“但是，很有启。”

    对于库克教授的指责，顾诚不以为意：“就像中医，不科学，但是有时候它确实可以治好病。只是要碰运气，而且解释不通其治好病的必然道理而已——但我只要疗效，不在乎科不科学。您有兴趣证明，完善学术体系，我很尊重您的想法。但我不太会为这些证明掏钱。我这次来，只想投资一些哪怕不科学也能用上的东西。”

    库克教授无奈地摇摇头：“真是可惜，有那么好的脑子，却不以投身科学为荣。”

    “没办法，我是产业界的人士，我在乎的是实用主义。”

    顾诚不再理会那个理想主义的老学阀，只是重新提出了自己的邀请。

    “库克教授，我今天言尽于此。我希望你不会用你的学术权威，去劝阻其他人投身产业界。我也非常欢迎您给我介绍人才，介绍从各种角度‘碰运气’的人才。”

    3年的东海岸，盘根错节的混逼格学者还是挺多的，成果和产业界的结合，普遍还停留在那些既能刷脸也能刷钱的成果。

    要到杰夫辛顿这一票人普遍想通之后，东海岸学界以钱衡量成功的氛围才会浓重起来。任何事情，都是一步步来的。

    “你们谁想去的，就去吧。我不会阻拦。至于第二个建议，我会考虑。”

第105章全面布局

    离开密西沙加校区的时候，林志凌依然觉得心里堵得有些感慨。

    “为什么这些人在多伦多那么好的学术氛围里，却无法挥出他们最大的价值呢？”

    顾诚对此倒是毫不感慨，显然早已没心没肺：“科学是很严谨的东西。如果你得了癌症，科学已经宣判了你的死刑，现在有一种吃了之后有1o概率懵对救命、但是生效机理不明的药，你吃还是不吃？造这种药赚钱的生意你做还是不做？

    要想拿图灵奖，这种生意就不能沾，这种研就不能做。如果只是要钱，要实用，就无所谓。我这辈子从来没想过拥抱科学，我最多只是利用科学。但是如果某个具体问题上科学还没巫术好使，我就用巫术好了。”

    史蒂芬库克是个伟人，但是跟顾诚混的圈子不相交。

    所以顾诚只能尊重对方的人品，但是道不同不相为谋，然后尽量从他手下挖走那些三观还没定型、“节操”没那么满满的学者。

    只要肯用名换钱，顾诚就有希望挖到。

    他在多伦多滞留了两天，好让杰夫辛顿有更多时间做手下人的思想工作。

    一切都很顺利，事情完全向着顾诚预想的方向进展着。面对巨额的研究经费和薪水，乃至未来可能的基础分红，和其他媒体渠道的出名机会，最终战胜了对学术上拿奖拿影响因子的欲-望。

    除了杰夫辛顿这个研究“深度学习算法”的流派之外，史蒂芬库克麾下其他几个技术路线的教授也略有松动，至少被顾诚挖走了两个副教授和一堆博士研究生。

    顾诚要的，就是这种效果。“跟着顾诚混，就算上不了核心期刊，照样可以在别的严肃媒体渠道出名，用另一种方式被世人记住”。

    第一步总是很艰难的，一旦这种念头在脑子灵活的基础科研能人心中扎根，顾诚的雪球就会越滚越大。

    为了完成这一切，顾诚也初步开出去了足足三千万美元的支票，给他新注册的空壳研究所和基金会注资。

    这笔钱几乎相当于“传奇”一个季度的毛利，而且目前这个机构还只能设在米国——顾诚试探着问过杰夫辛顿，“如果让大家去华夏工作，并且加钱，有多少人愿意走”，但结果是愿意跟着他跑的人数至少会降低三分之二。

    华夏如今给白人的印象，还是太不透明了，要是再过个五年十年，情况绝对会倒过来。

    所以顾诚决定目前还是先在米国设立一个研究机构，以及yy网络科技的子公司，过个两三年等他盘面更大了，再从长计议把核心研人员挪去华夏。

    ……

    “深度学习算法”是未来人工智能的鼻祖，虽然不是其唯一实现路径，却为人类开启了一条“让机器慢慢根据数据标识自我修正”的思路。

    历史上，这一技术最初的应用场景，其实是谷歌的图片搜索引擎，和facebook的人脸识别技术。

    在此之前，谷歌搜索只能搜文字信息，却没法搜图片——

    别看百度和谷歌都很早就开放了“百度图片”之类的功能，但是最初的“百度图片”并不是根据图片的内容来决定搜索结果的，而是靠该图片所属的网页链接的文字标题来搜的。

    所以o9年以前的“百度图片”功能，其实并不是真正“读懂”了图的内容。只不过外行用户只看疗效，所以并没有在这段还算平滑的技术过渡中察觉出什么异常，还以为后来的“百度图片”识图率“自然而然”就提高了。

    只有基于深度学习为代表的新一代人工智能真正应用之后，人类才学会了让机器直接读图本身。

    不过，这个应用场景虽然很宏大，却跟顾诚的生意没什么关系。那是需要百度李老板和阿狸马风去操心的。李老板将来或许可以做图片搜索，马风则可以做淘宝找同款。顾诚最多在合适的时机提点一下、换取自己的好处，却不会亲自下场。

    深度学习型人工智能的第二个应用场景、也就是平行时空facebook的人脸识别，则是和顾诚眼下的生意非常契合的。

    如今，扎克伯格还不是一个胸怀大志的家伙，他只想着在哈佛女生当中扬名立万，被无数人崇拜，混进最顶级的豪门俱乐部。所以十有会被顾诚劝诱至麾下。顾诚也不打算另搞facebook了，而是准备直接在海外运营“yy网”。

    考虑到墙的因素，以及墙里墙外的内容差异，到时候国内那部分就把英文的“yy网”倒过来，改叫“人人网”好了。

    名字不重要，反正两者最后都会是基于yy的朋友圈类空间产品。

    国内腾云那边，马腾如今正在做qq空间，而且腾云的资金链比较紧张。等qq空间误入歧途之后，顾诚再公布自己的开计划教做人也来得及。

    按照这个计划，顾诚估计他回国后全面推进“yy网”和“人人网”的开计划、四季度十一黄金周前后上线网站，基本上就可以卡住几个关键时间点。

    除了历史上facebook和谷歌已经干过的事情之外，“深度学习”在顾诚手中自然还有他独到的用处，那就是“用户偏好分析”。

    这事儿在平行时空的起步，比前两项应用要晚得多，但顾诚深知那并不是这件事情技术上比前两项难多少，而是因为平行时空最初接触深度学习型人工智能的巨头们，统统都没有涉猎娱乐/内容产业。

    换言之，如果第一批接触深度学习人工智能的换成亚马逊公司，“用户偏好分析和推送”肯定会变成第一优先级的存

本文每页显示5000字共359页当前第161页

目录上一页 ← 161/359 → 下一页加入书签

小提示：如您觉着本文好看，可以通过键盘上的方向键 ← 或 → 快捷打开上一页、下一页继续在线阅读
也可以下载文娱救世主TXT电子书到您的看书设备，以获得更快更好的阅读体验！