「Ta在」团队打造首款以实现全球脑为目标的KNS产品
- 时间:
- 浏览:0
在5G时代,ECI算法可以吸收更多的知识和经验。低延迟和快速传输速率使云服务器能够以与本地CPU相当的速度处理数据。再加上可穿戴设备等物联网设备的普及,全球大脑将能够发挥更大的能力。Ta已经在与许多中国海外团队合作,探索如何将ECI算法整合到这些团队的内容推荐和电子商务系统中。“我们怎样才能使人类更聪明呢?”在人类第一颗原子弹爆炸之前,曼哈顿计划的创始人瓦内弗·布什一直在考虑这个问题。1945年7月,在新墨西哥州的沙漠中,一枚相当于20,000吨梯恩梯的核武器将巨大的蘑菇云喷射到离地面近10,000米的地方,最终在沙漠中留下了一个10米宽的陨石坑。一个月后,同样的大洞出现在广岛和长崎。第二次世界大战结束了。总共有9名科学家参加了实验。一个科学家用自己的双手看到如此壮观的景象,很难不说些什么。但在7月,蘑菇云升起的时候,布什给大西洋月刊写了一封信,信与原子弹无关。在一篇题为“我们可能会想到的”的文章中,布什得出了一个悲观的结论。“人类获得的经验正在迅速增加,但我们从知识迷宫中获取信息和知识的方式却与我们过去建造帆船时一样巨大。这样一个大问题来自布什管理曼哈顿计划的经验。战前,科学家们在实验室里独自一人,挑战特定领域的棘手问题。曼哈顿计划则恰恰相反:一个国家权力机构将物理、化学、材料等领域的科学家聚集在一起,分享各自领域的前沿知识,并在团队中合作。布什担心的是,随着战争的结束,这样的思想协调会继续下去吗?生物通过合作进化出更高的智能并不是美国人的第一个,这是自然界不变的法则。以蜜蜂为例,个体的智商不是很高,但集体合作可以创造出完美的蜂巢。19世纪,著名科学家尼古拉·特斯拉预言,有一天,世界将连接全人类的思想。地球将成为大脑,而每个人都将成为神经元。
预言毕竟是预言。人类大脑中的生物电使信息在神经元之间传递。但是,如果我们想把信息从人脑中分离出来,让信息在不同的人、学科和主题之间自由流动,那显然就太难了。在布什看来,在获取、存储和连接信息方面存在着深刻而具体的问题。最高质量的信息并不能立即到达最需要它的人,当涉及到信息的存储时,我们仍然依赖于经典的卡片和百科全书。如果我们不重新思考人与信息之间的关系,并利用计算机的力量来提高效率,那么全球大脑的愿景将变成一座空中楼阁。布什在《如我所想》一书中提出的困惑为整整一代计算机和互联网的发明者设定了目标。在原子弹爆炸74年后,我们让机器在获取和存储信息方面发挥了重要作用。搜索引擎、内容交付算法和社交网络可以快速地用信息填充每个人的空闲时间。无论是巴黎圣母院的火灾,还是明天的最后期限,我们都知道这一点。然而,在信息连接方面,还没有取得突破。人类有自己独特的思维模式,一旦我们掌握了一种信息,我们就会立刻联想到另一种信息。布什说:“人类行为的速度,心灵轨迹的复杂性,想象力的微妙性,这些都是机械指数所不可能实现的......人类不能希望人工完全复制心理过程,但人类肯定可以从中学习。”
以此为标准,回顾过去几十年互联网的变化,我们可以看到它已经偏离了“信息连接”的初衷。由少数人设置的标记算法限制了我们自由探索知识边界的能力。内容越多,你就不会得到认知上的提升,但你会因为信息过载而感到焦虑。社交媒体不能解决知识共享的问题如果把人与信息的互动分成获取、存储和连接三个环节,那么计算机在前两个环节上似乎做得很好,但在“连接”上却无能为力。这是因为在实践中,计算机还不足以让人类获取和存储信息。
从互联网上,用户--知识系统基本上使用基于入门的系统来创建和维护术语和知识点--推荐选择用户可能感兴趣的内容--搜索本质上是基于关键字和内容匹配来呈现结果--上述系统中的每一个都取得了巨大的成功,但也面临着自身的问题和发展瓶颈。主要原因是,这些系统是由少数人进行的自上而下的知识转移,并没有利用所有人的大脑。首先,我们来看看“知识网站”,包括知识系统和社交媒体。它的优点是信息粒度低,可以覆盖大量的内容。缺点也很明显,一是准备和维护无尽的新知识点是非常困难和繁琐的,容易泄漏。第二,它不能随着知识的变化和相互关系而进一步进化和自我组织。这在实际使用中是显而易见的。维基百科无法发现新知识并对其做出反应,它只能让用户去创造新知识。知识是被动地吸收知识,需要有人提出问题来建立新的知识点。这是因为用户UGC生成的内容的含义在不断变化,这使得机器不仅很难理解内容本身,而且很难理解意识和感官层面的知识,这些知识之间的联系也很难抽象。除了知识网站之外,今天的许多用户还依赖于今天的头条新闻推荐系统。这些系统中的大多数使用固态神经网络。为了将人与机器连接起来,算法建立了一个标记机制。内容由编辑手册或NLP模型标记,基于协同过滤的算法将用户映射到标签。这种方法的问题在于,它依赖于一维标签来跟踪用户,结果可能是非理性的、扭曲的、扭曲的或扭曲的,往往放大了一个人对特定内容的喜好和厌恶。此外,许多高质量的内容可能不包含明确的标签,音频、视频、图像等都很难用关键词来描述。最后一类是基于连锁的社交媒体,如微博和Facebook。这类产品仅根据用户之间的共同兴趣进行信息传递,但由于缺乏系统的知识结构来支持它,因此只能恢复人与人之间基于人际关系链的物理联系,很难传达个人思想和知识的表达。例如,我想在微博上了解有关日本文化的信息。唯一的方法是跟随“日本文化博客”。他给我发了很多我感兴趣的东西,但他也分享了我的个人生活。此外,遵循只有流的理论,越来越多地关注一个人,不是因为彼此产生共鸣,而是因为对方有更多的发言权。与“人人都能发声”的BBS相反,以Facebook、微博为代表的社交网络,通过相关人员和粉丝来限制信息的传播能力,这种传播能力甚至可以通过商业手段进行营销。这使得它不再是一个传播观点和内容的公平平台。随着社会属性的增强,知识属性的减弱。因此,我们可以总结一下与获取信息有关的一些问题。- 信息过于依赖(少数)人的交流,导致推荐质量下降-缺乏自我进化能力,适应新信息的速度缓慢-产品更注重链的稳定性,而不是知识传播的效率-标签系统使人们不可能成为“互联网游牧民”,在不同的内容之间自由漫游。由于这些原因,现有的工具只能作为“信息源”,而不是被标签锁定在小网格中。它是以机器为中心而不是以人为中心的,因此它不能与有机的思维过程发生冲突。无论是维基百科还是维基百科,它都像是一个由超快CPU编译的字典,是一个巨大的“机械化索引”的集合。作为用户,我们希望工具取代搜索和搜索等“肮脏的工作”,这样我们就有更多的时间去理解和消化新知识。要做到这一点,我们需要工具,尽可能地适应人类的思维模式,并像人类一样寻找、编辑、联想和思考。信息是否会远离人,在互联网上自由传播、碰撞和连接,用户不再需要关注任何人,就可以得到准确的信息。信息的传播不再需要贴标签,由博客作者转发,由志愿者维护,而是由吸收集体智慧的“全球大脑”决定。这个“全球大脑”能够在每个人的帮助下自主地进化和成长,了解资讯与资讯之间的关系,实现真正的联系。从2015年开始,Ta in团队开始在美国创建全新的算法来解决这些问题。在这种被称为ECI的进化集体智能算法下,我们可以通过大脑的知识属性和兴趣属性自动连接,而不是基于认知或其他社会关系,从而建立超越个人智能的集体智能。完成该算法的团队于2018年11月推出了世界上第一个KNS(Knowledge Network Services)产品“Tine”,以实现全球大脑。
ECI算法的优点之一是自我进化。这是大多数信息收集方法的弱点。例如,像亚马逊和淘宝这样的电子商务都是基于标签系统,该系统可以根据用户看到的产品生成新的推荐。这种方法就像一台机器(以及它背后的有限数量的程序员)对用户的购买行为进行范式感知,然后猜测用户喜欢什么。这种机器逻辑有时会导致非常糟糕的用户体验,例如根据用户购买的内容反复推荐相同的产品。另一方面,ECI算法的内容交付逻辑是基于多个人的判断,而不是基于逻辑或内容评论等本地个人的喜好。它可以学习大量用户的习惯,将信息传递给单个用户,根据用户的反应修改系统的判断,推送给用户,反复学习。在长期相互判断的过程中,ECI算法将继续进化,以达到提高群体智力的目的。每个人都可以享受整个平台的判断力贡献。最直观的例子是,每个“Ta in”帖子下的相关推荐都是动态的,在群体共同判断的基础上长期演进,不断变化和调整,变得更加全面和准确。
与这种动态算法相对应的是知识的分类,这种分类同样进化。现有的SNS依赖于人类编辑者的分类和内容发布者的有意识的标签分类。这显然是一个现实的妥协。电影有这么多的类别,每一个类别都是如此复杂和多样,以至于我们显然不可能依靠人类来获得准确的标签。“Ta in”使用ECI算法来识别内容。相同的内容被分类为多个标签维度(知识属性维度),这种分类一直在进化。它消除了内容埋藏得太深而无法发现或连接的问题。该平台始终提供灵活的内容访问。问题解答和知识检索产品可以充分利用这种进化分类的优势。现有平台的最大缺点是,为了开始提问,您必须首先找到一个回答特定类别问题的受访者。这无疑是违反直觉的。在ECI算法中,只要用户提出问题或内容,算法就会根据内容或问题的特点自动连接相应的内容或人,间接建立人与知识的联系,最后将知识传播给爱好相同的人。谷歌和百度都无法做到这一点,因为现有的标记算法无法耗尽人类复杂的多维属性。随着进化的逐渐稳定,形成了稳定的知识结构和人际关系结构。ECI算法可以计算各内容点、知识点、兴趣点与其他内容点的知识点的兴趣点之间的关系(有多相似),或者它们之间的关系如何。当这种关系在分析上变得更加准确时,“Tyne”最终形成了一个庞大的知识体系、知识图和知识库。那么,这个算法是如何进化的呢?为了说明这一点,Ta Jin在全球大脑平台上设置了一个名为CIQ的数字,以描述该平台的智能水平。目前Ta in平台的CIQ值为18,相当于智商为18的人。但即便如此,ECI算法仍具有巨大的潜力。目前,“Ta in”的高回复率表明,算法正在将问题推送到感兴趣或有经验的人身上。当CIQ达到100时,“Ta in”平台的知识量等于知识量。随着内容宽度的增加,算法可以更快地将内容关联起来。当CIQ达到1000时,知识的数量将达到谷歌的水平。发布后10到20秒,瀑布会显示其他非常相似的内容推送。除了自动进化和混合智能(结合了人与机器的判断),ECI算法最重要的一点是最大限度地利用用户规模,不断改善用户体验。在其他社交平台上,用户增长会减少用户的边际收入。用户和内容的数量越大,点击内容后,垃圾邮件就会越多。在ECI算法下,用户规模越大,作为分发引擎的“全球大脑”可以更多地了解用户的习惯,提高智能性,因此推送给用户的内容就越准确,垃圾邮件也就越少。
到目前为止,Ta in团队已经在其内容产品中展示了ECI算法的强大功能。根据该团队的说法,下一步是将算法连接到外部平台,以更轻的模式探索ToB场景中的可能性。如前所述,许多现有的电子商务和内容平台都使用标签系统进行内容推荐,缺乏自我进化和学习能力。这使得平台上的B端缺乏消费者洞察力,无法提高购买转化率,用户经常收到垃圾信息,造成信息过载。几年前,“骨灰盒”的消息引起了一定程度的骚动。一位用户偶然在淘宝上搜索了一个产品,但系统在一段时间内反复向他推荐类似的产品。毕竟,淘宝背后的推荐算法并不了解“骨灰盒”到底是什么样的产品,也不了解它的功能属性和使用频率。ECI算法真正了解每种商品是什么,并根据用户的情况和兴趣进行推荐,因此推荐引擎可以真正帮助用户,而不是垃圾邮件生产者推动实际购买。随着购买量的增加,电商平台可以根据用户的消费心理获得更多的用户洞察力,比如计算出以前没有的产品关系,实现创新的产品推荐,更有效地刺激相关消费。换句话说,亚马逊可能只推荐婴儿配方奶粉放在尿布旁边。然而,ECI的算法允许你推荐爸爸们感兴趣的产品,比如啤酒。在5G时代,ECI算法可以吸收更多的知识和经验。低延迟和快速传输速率使云服务器能够以与本地CPU相当的速度处理数据。再加上可穿戴设备等物联网设备的普及,全球大脑将能够发挥更大的能力。以教育业为例。如前所述,ECI算法可以连接和扩展知识点,从而使“Ta in”产品的Q & A模块的活跃率非常高。这条路径也可以应用于其他教育产品,成为5G时代的重要应用。众所周知,很多教育产品都以视频为主要形式,视频内容的结构化非常困难,目前还停留在手动标记和目录系统的阶段。更快的数据传输速度意味着视频可以被训练并传送到世界各地的大脑。该产品能够真正突破现有的教学课程,对知识体系进行横向探索,判断用户在学习过程中的兴趣和主动性。ECI驱动的问题搜索不仅返回文本结果,还返回详细信息,如相关图像和视频。这与4G时代有很大的不同。目前,Ta Jin正在与中国的许多海外团队合作,探索如何将ECI算法整合到这些团队的内容推荐和电子商务系统中。与此前全球脑产品“Ta In”不同,这些外部合作将是ECI算法的一个热门开端。该团队希望与外部产品合作,采用更轻的模式,如技术股票和股息。只有这样,ECI算法才能进入更大的世界,吸收更多人的知识和经验,不断提高算法的智能性。电脑科学家Alan Kay说:“最好的工具始于启发人类创造的工具”,在ECI演算法的帮助下,了解自我进化和学习,知识不再随机堆叠在硬盘的角落里,而是可以自由流动和连接。这种联系将在每个人身上产生思想的火花。到那时,“用计算机提高人类智能”的日子就会到来。