首页 > Web3.0 > CoinFund:AI再次流行,通过Web3构建更加公平开放的AI系统

CoinFund:AI再次流行,通过Web3构建更加公平开放的AI系统

摘要:技术创新永无止境,人工智能(AI)尤其如此。在过去的几年里,我们看到深度学习模型的重新流行并成为了 AI 的先驱。这些模型由密集互连的节点层组成,节点间相互传递信息,它们大致类似人类大脑的构造,因而也被称为神经网络。在 2010 年代初期,最先进的深度学习模型还只拥有数百万个参数,被用于特定情绪分析

技术性创新永无止境,人工智能技术(AI)尤其如此。在过去几年里,你看到的深度神经网络模型的再次时兴并变成了 AI 的先行者。这种模型由聚集互联的连接点层构成,连接点间互相信息传递,他们大概类似人类的大脑的结构,因此又被称为神经元网络。

在 2010 时代前期,最先进深度神经网络模型还只有着数百万个主要参数,被用来特殊情绪分析和皮内瘤监管。而现在最先进模型则已经将近一万亿个主要参数,如DreamStudio、GPT-3、DALL-E 2和Imagen,他们已经进行和人类工作中复杂性相提并论、乃至更具有创造性每日任务。

以下边这个图片为例子,是由 AI 产生的,线框相对高度细腻、锋利。除此之外,还逐渐看到这个模型的社会里和文化的影响,他们描绘了大家学习新事物、彼此之间互动交流和创造力表达自己方法。

但是,现如今练习一些大中型「神经元网络」的诸多关键技术、重要数据集和测算能力却大部分都是封闭式源码,然后由谷歌搜索和 Meta 等各大科技有限公司操纵。尽管 GPT-NeoX、DALLE-mega和BLOOM等拷贝开源模型已由StabilityAI、EleutherAI和HuggingFace等机构带领,但仍然可以通过 Web3 来进一步增强开源 AI。

从总体上,AI 的 Web3 基础设施层能够引进开源开发设计、小区使用权和处理及其通用性浏览元素,进而在开发设计这种新技术应用时创造更多模型和高效率。

除此之外,选用 AI 技术性都将提高 Web3 的诸多重要测试用例,如从形成造型艺术 NFT到 Metaverse 。而且开源 AI 非常符合 Web3 对外开放、区块链技术和民主建设的奋斗精神,它代表着 Big Tech 所提供的 AI 替代选择。

各种基本 AI 模型

基本模型要在很多数据集上锻炼的「神经元网络」,用以实行往往需要智能化人类行为任务,这种模型造就了一些让人印象深刻得到的结果。

OpenAI 的GPT-3、Google 的 LaMDA和 Nvidia 的 Megatron-Turing NLG 等语言表达模型具备认知和造成自然语言理解、总结归纳及生成文字,乃至撰写计算机代码 的能力。

DALLE-2 乃是 OpenAI 的文字到图象蔓延模型,能从书面形式文字中形成与众不同的图象。并且谷歌搜索的 AI 单位 DeepMind 早已形成了市场竞争模型,包含 PaLM(一个 540B 主要参数语言表达模型)、与它自已的图像生成模型 Imagen,已经在 DrawBench 和 COCO FID 的标准上好于 DALLE-2,Imagen 特别是在能够产生更逼真实际效果并且具有拼读能力。

除此之外,Google 的AlphaGo等增强学习模型还战胜了人们围棋世界冠军,与此同时看到了中国围棋三千年在历史上从没出现过的新奇方案和下象棋方法。

创建繁杂基本模型的比赛现在开始,Big Tech 处在创新性的前沿。但是虽然这一领域的发展令人激动,依然存在一个重要主题值得注意。那就是在过去十年中,伴随着 AI 模型变得更加繁杂,他们也变得越来越不往群众对外开放。

另一方面,互联网巨头已经全力投向生产制造该类模型并把数据与编码保存为专有技术,并且通过其模型训练和计算出来的规模效应优点来维持其市场竞争环城河。而对任何第三方而言,形成基本模型则都是一个资源密集型全过程,主要是存有三个短板:数据信息测算货币化安置

但是,我们已经看见了一些 Web3 主题已经处理在其中一些问题的初期进度。

数据集生产制造可以通过 Web3 使用权开展汇聚

标识数据集针对搭建合理模型尤为重要,AI 系统软件根据从数据集里的实例开展归纳去学习,并随着时间推移不断完善。

但是,除开云计算服务器以外,高质量数据集编译程序和标识还要专业的基础知识与处理。大中型科技有限公司一般会有内部结构数据团队专业应用大中型特有数据集和IP 系统软件来练习他的模型,而且基本上没有动力对外开放并对数据库的生产或派发的浏览。

但是,还是有一些小区开始向全世界科研人员小区对外开放和浏览的模型练习,如下列事例:

- Common Crawl是十年互联网数据的公共性存储库,适合于一般培训。(虽然研究发现,更精准、更精减的数据集能提高模型的一般跨学科专业知识)

- LAION是一个非营利性组织,致力于向社会给予规模性机器学习算法模型和数据集,并发布LAION5B,这是一个 58.5 亿 CLIP 过虑的图象-文字对数据集。LAION5B 公布后变成了全球最大可公布浏览图象-文字数据集。

- EleutherAI是一个中心化的数据集,它发布最大的一个开源文本数据 The Pile。The Pile 是一个 825.18 GiB 的英语文化数据集,用以应用 22 种不同数据库的言语模型。

现阶段,这种小区全是非正式组织,并取决于普遍志愿者的奉献。为了能让他的投入更有意义,Token 奖赏能够被作为建立开源数据集的激励制度。比如也可以根据实际奉献传出 Token,并标识大中型文字图象数据集,DAO 小区则可认证该类申明。

最后,大中型深度神经网络模型能从一个公共性池里发售 Token,而且根据上述模型搭建新产品的中下游收益还可以捕捉到 Token 其价值中。用这种方式,数据集推动者乃至能通过他的 Token 拥有大中型模型的股权。

除此之外,编译程序搭建较好的开源数据集针对扩张大中型模型的探索可访问性和提升模型特性尤为重要。与此同时能通过提升不同种类图象大小和过滤装置来拓展文字图象数据集,以获得更细致的结论,如将必须非英语数据集来练习非英语群体可以用的自然语言理解模型。随着时间推移,我们将要可以用 Web3 的形式迅速、更公开地完成这种结论。

AI 测算将转移至去中心化网络

练习规模性「神经元网络」所需要的算法是基本模型中最大的一个短板之一。在过去十年中,练习 AI 模型计算要求每 3.4 个月翻一番。在这段时间,AI 模型逐渐从图像识别技术到应用强化学习算法,再到策略游戏中战胜人们总冠军,及其运用变电器练习语言表达模型。

比如,OpenAI 的 GPT-3 有 1750 亿次主要参数,练习时间为 3640 petaFLOPS-day。在世界上最快的高性能计算机上,这就需要两个星期时长,而规范笔记本就需要一千年之上的时间去测算。伴随着模型的尺寸不断增加,测算仍是这一领域持续发展的短板。

AI 高性能计算机需经过的优化特殊硬件配置,以实行练习「神经元网络」所需要的数学运算,比如图型控制部件 (GPU) 或专用集成电路 (ASIC)。现如今,对于该类测算的优化大部分硬件配置均由极少数寡头云服务提供商操纵,如 Google Cloud、Amazon Web Services、Microsoft Azure 和 IBM Cloud。

那也是下一个关键交接点,我们将要见到根据公共性开放网络开展区块链技术测算分派得到驱动力,区块链技术整治适合于支助和资源分配以学习培训小区驱动新项目。除此之外,区块链技术的行业模型能够跨地区公布浏览,那样一切科研人员都能够浏览云计算服务器。

想像一个根据发售 Token 来众筹项目模型锻炼的悬赏金系统软件,成功众筹项目将向其模型得到优先选择测算,并且在需要量多的地方推动创新。比如,假如 DAO 强烈建议形成西语或印地语 GPT 模型以立足于大范围的群体,则能将研究方向放到这一领域。

但是像GenSyn这样的企业早就在勤奋运行协议书,以激励融洽取代、经济发展高效率和根据云的硬件配置浏览以开展深度神经网络测算。随着时间推移,伴随着勇于探索 AI 前沿的,应用 Web3 基础设施建设搭建的分享、区块链技术全球计算网络将显得更具有成本效益分析,能够拓展并能够更好地给我们服务项目。

开放获取和产品融洽

在过去几年里,大中型模型变得更加私秘,由于生产制造他们所需要的网络资源项目投资早已推动项目持续变成封闭式源码。因此,可以通过开源人工智能技术模型使之上阐述得以实现。

以 OpenAI 为例子。OpenAI 成立时间 2015 年,是一家非盈利性科学研究试验室,其使命是为人类利益生产制造通用性 AI,这和当年的 AI 管理者谷歌搜索和 Facebook 形成了鲜明的对比。

随着时间推移,激烈竞争和经济压力腐蚀了清晰度和开源编码理想的,由于 OpenAI 转为盈利性方式并和微软公司签订了 10 亿美元高额商业服务协议书。除此之外,近期的分歧乃是围绕他的文字-图象模型 DALLE-2 普遍的审查机制。

DALLE-2 禁用「枪」、「运行」、「伤害」、「乌克兰国家」和知名人士图象等专业术语,这类粗暴审查机制阻拦例如「勒布朗詹姆斯进攻篮球框」或「程序猿执行代码行」等相关信息,及浏览这种模型的个人公测版对西方国家客户具备暗含的地理成见,这切断全世界绝大多数人口数量和这些模型的互动。

这个不是 AI 应当传递的方法:只由几个大中型科技有限公司维护监管和。与区块链一样,新技术应用应当尽量平等地运用,那样它也就不会都集中在极少数可以用的人身上。用不同领域、地域当地社区中公布运用 AI 复合进度,一同发觉极具诱惑力的测试用例,并针对 AI 的公平公正应用达成一致。

依靠通用性基本模型的 Token 构造,将有可能会集聚更大的贡献者池,这种推动者能够在发编码开源的前提下把它工作中货币化安置。像 OpenAI 那样充分考虑开源而搭建的新项目迫不得已转为一家单独的支助专业公司角逐顶尖人才和网络资源。

Web3 容许开源在项目财务上一样能够赚钱,并进一步与由 Big Tech 私人投资领导干部的一个项目市场竞争。除此之外,在开源模型以上搭建新产品的创新者能够自信地展现搭建最底层 AI 的清晰度,随后它也会被中下游的一些新式 AI 测试用例迅速选用和发售。

在 Web3 空间内,这涉及安全性应用软件对区块链智能合约系统漏洞和所进行的分析预测,适合于锻造 NFT 和建立元宇宙概念园林景观的图象制作器 可存在链上以保存本人所有权 数据 AI 个性化这些。

结果

AI 是现代发展趋势速度最快的技术性之一,将对咱们社会造成很大影响。现如今,这一领域由大中型科技有限公司核心,由于对人才、数据与计算出来的投资理财为开源开发设计造就了极为重要的环城河。将 Web3 集成化到 AI 的基础设施层是保证 AI 系统软件以公平公正、对外开放与可浏览的形式搭建的关键因素。

己经见到对外开放模型在 Twitter 和 Hugging Face 等公共空间中迅速占有公共性自主创新位置,而 Web3 能够促进这种努力向前发展趋势。

原文链接


Tags:
免责声明
世链财经作为开放的信息发布平台,所有资讯仅代表作者个人观点,与世链财经无关。如文章、图片、音频或视频出现侵权、违规及其他不当言论,请提供相关材料,发送到:2785592653@qq.com。
风险提示:本站所提供的资讯不代表任何投资暗示。投资有风险,入市须谨慎。
世链粉丝群:提供最新热点新闻,空投糖果、红包等福利,微信:juu3644。