Данные как активы: DataFi открывает новое море возможностей
В мире сейчас идет гонка за создание лучших базовых моделей. Хотя вычислительная мощность и архитектура моделей важны, настоящим конкурентным преимуществом являются обучающие данные. Главной новостью в мире ИИ в этом месяце стало то, что Meta продемонстрировала свои силы: Марк Цукерберг активно нанимает талантов и сформировал роскошную команду ИИ, состоящую в основном из китайских исследователей. Возглавляет команду 28-летний Александр Ванг, который создал Scale AI, в настоящее время оцененную в 29 миллиардов долларов, предоставляющую услуги по обработке данных для нескольких конкурирующих гигантов ИИ, включая американские вооруженные силы, OpenAI, Anthropic и Meta. Основной деятельностью Scale AI является предоставление большого количества точных аннотированных данных.
Путь к успеху Scale AI
Причина, по которой Scale AI выделяется среди множества единорогов, заключается в том, что она рано осознала важность данных в индустрии ИИ.
Мощность, модель и данные являются тремя основными столпами AI модели. Если сравнить большую модель с человеком, то модель – это тело, мощность – это пища, а данные – это знания/информация.
В процессе быстрого развития LLM акцент в индустрии сместился от моделей к вычислительной мощности. В настоящее время большинство моделей уже утвердили transformer в качестве основы, иногда появляются такие инновации, как MoE или MoRe; крупные компании либо создают собственные суперкомпьютерные кластеры, либо подписывают долгосрочные соглашения с облачными провайдерами для решения проблем с вычислительной мощностью. После удовлетворения базовых потребностей в вычислительной мощности важность данных постепенно становится более очевидной.
Scale AI стремится создать надежнуюData базу для AI моделей. Их бизнес включает не только добычу существующих данных, но и внимание к долгосрочному бизнесу по генерации данных. Компания формирует команды по обучению AI из экспертов в различных областях, чтобы предоставить более качественные данные для обучения AI моделей.
Два этапа обучения модели
Обучение модели делится на две части: предварительное обучение и дообучение.
Предварительное обучение, аналогичное процессу, через который проходят человеческие младенцы, когда учатся говорить, требует ввода в модель ИИ большого количества текстов, кода и другой информации, собранной из Интернета, чтобы модель могла самостоятельно освоить основные навыки общения.
Финетюнинг аналогичен учебе, обычно есть четкие правильные и неправильные ответы, а также направление. Разные "школы" будут воспитывать "таланты" с разными характеристиками. Мы используем некоторые тщательно подготовленные, целенаправленные наборы данных, чтобы наделить модель необходимыми нам способностями.
Таким образом, нам нужны два типа данных:
Обширные данные, которые не требуют значительной обработки, в основном поступают из данных пауков крупных платформ UGC, открытых баз данных литературы, частных баз данных предприятий и т.д.
Специально разработанные и отобранные профессиональные наборы данных требуют работы по очистке данных, отбору, аннотации, обратной связи от пользователей и т.д.
Эти два типа наборов данных составляют основу AI Data трека. В настоящее время считается, что с постепенным исчезновением преимуществ вычислительной мощности данные станут ключевым фактором для производителей крупных моделей в поддержании конкурентоспособности.
С повышением способности модели разнообразные более тонкие и профессиональные тренировочные данные станут ключевыми факторами, определяющими способности модели. Если сравнить обучение модели с подготовкой мастера боевых искусств, то качественный набор данных — это лучший учебник по боевым искусствам.
В долгосрочной перспективе AI Data является долгосрочной нишей с эффектом снежного кома. С накоплением первоначальных работ данные активы будут иметь способность к сложным процентам, а их ценность будет расти с течением времени.
Web3 DataFi: Идеальная почва для AI данных
По сравнению с традиционными компаниями по обработке данных, Web3 обладает естественными преимуществами в области AI-данных, что привело к появлению концепции DataFi.
В идеале, преимущества Web3 DataFi включают в себя:
Умные контракты обеспечивают суверенитет данных, безопасность и конфиденциальность
Распределенная архитектура привлекает наиболее подходящую глобальную рабочую силу
Блокчейн предоставляет явные преимущества в стимуляции и расчете
Способствует созданию эффективного и открытого единого рынка данных
Для обычных пользователей DataFi — это самый простой децентрализованный AI проект для участия. Пользователям достаточно просто войти в кошелек, чтобы участвовать в нем, выполняя различные задачи, такие как предоставление данных, оценка моделей, использование AI инструментов для простого творчества, участие в торговле данными и т.д.
Потенциальные проекты Web3 DataFi
В настоящее время несколько проектов DataFi получили крупное финансирование, ниже приведены некоторые из представительных проектов:
Sahara AI: стремится создать инфраструктуру и рынок для децентрализованного ИИ
Yupp: платформа обратной связи для AI-моделей, собирающая отзывы пользователей о выводах моделей
Vana: Превращение личных данных пользователей в цифровые активы, которые можно монетизировать.
Chainbase: сосредоточение на данных цепочки, охватывающих более 200 блокчейнов
Sapien: Превращение человеческих знаний в качественные данные для обучения ИИ
Prisma X: нацелен на создание открытого координационного слоя для роботов
Masa: дочерний проект экосистемы Bittensor, предоставляющий доступ к данным в реальном времени
Irys: Сосредоточен на программируемом хранении данных и вычислениях
ORO: наделение обычных людей возможностью участвовать в вкладе в ИИ
Gata: децентрализованный уровень данных, предлагающий множество способов участия в данных
Эти проекты в настоящее время имеют общие низкие барьеры, но с накоплением пользователей и экосистемной привязанности преимущества платформы быстро сформируются. Ранние проекты должны сосредоточиться на стимульных мерах и пользовательском опыте, чтобы привлечь достаточное количество пользователей.
В то же время этим платформам необходимо обратить внимание на то, как управлять человеческими ресурсами, обеспечивать качество данных и избегать явления "плохие деньги вытесняют хорошие", вызванного "помощниками". Некоторые проекты, такие как Sahara и Sapien, уже начали подчеркивать качество данных и стремятся установить долгосрочные и здоровые отношения с пользователями платформы.
Кроме того, повышение прозрачности является одной из текущих проблем, с которыми сталкиваются проекты на блокчейне. Многие проекты все еще должны ускорить шаги к открытости и прозрачности, чтобы способствовать долгосрочному здоровому развитию Web3 DataFi.
Масштабное принятие DataFi необходимо продвигать с двух сторон: во-первых, привлечь достаточное количество индивидуальных пользователей для участия в сборе/генерации данных, чтобы сформировать потребительскую группу для ИИ-экономики; во-вторых, получить признание от основных компаний, поскольку в краткосрочной перспективе они являются основным источником крупных объемов данных.
Заключение
С одной стороны, DataFi - это использование человеческого интеллекта для долгосрочного обучения машинного интеллекта, при этом через смарт-контракты гарантируется доход от человеческого интеллектуального труда, в конечном итоге наслаждаясь вознаграждением от машинного интеллекта.
Для тех, кто испытывает неопределенность в эпоху ИИ или все еще сохраняет идеалы в области блокчейна, следовать за капитальными магнатами и погружаться в DataFi является разумным выбором.
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
16 Лайков
Награда
16
4
Поделиться
комментарий
0/400
SneakyFlashloan
· 19ч назад
Боже мой, 28 лет и 290 миллиардов. Мне стоит постараться!
Посмотреть ОригиналОтветить0
MetaMuskRat
· 19ч назад
Снова Зак делает что-то забавное, смеюсь до слез.
Посмотреть ОригиналОтветить0
NftDataDetective
· 19ч назад
кажется, цукерберг наконец-то понимает... данные — новая нефть, по факту
Посмотреть ОригиналОтветить0
AirdropChaser
· 19ч назад
Сидите и смотрите, это действительно денежный проект, пришло время для размещения.
DataFi: Web3 продвигает новую тенденцию активов данных AI
Данные как активы: DataFi открывает новое море возможностей
В мире сейчас идет гонка за создание лучших базовых моделей. Хотя вычислительная мощность и архитектура моделей важны, настоящим конкурентным преимуществом являются обучающие данные. Главной новостью в мире ИИ в этом месяце стало то, что Meta продемонстрировала свои силы: Марк Цукерберг активно нанимает талантов и сформировал роскошную команду ИИ, состоящую в основном из китайских исследователей. Возглавляет команду 28-летний Александр Ванг, который создал Scale AI, в настоящее время оцененную в 29 миллиардов долларов, предоставляющую услуги по обработке данных для нескольких конкурирующих гигантов ИИ, включая американские вооруженные силы, OpenAI, Anthropic и Meta. Основной деятельностью Scale AI является предоставление большого количества точных аннотированных данных.
Путь к успеху Scale AI
Причина, по которой Scale AI выделяется среди множества единорогов, заключается в том, что она рано осознала важность данных в индустрии ИИ.
Мощность, модель и данные являются тремя основными столпами AI модели. Если сравнить большую модель с человеком, то модель – это тело, мощность – это пища, а данные – это знания/информация.
В процессе быстрого развития LLM акцент в индустрии сместился от моделей к вычислительной мощности. В настоящее время большинство моделей уже утвердили transformer в качестве основы, иногда появляются такие инновации, как MoE или MoRe; крупные компании либо создают собственные суперкомпьютерные кластеры, либо подписывают долгосрочные соглашения с облачными провайдерами для решения проблем с вычислительной мощностью. После удовлетворения базовых потребностей в вычислительной мощности важность данных постепенно становится более очевидной.
Scale AI стремится создать надежнуюData базу для AI моделей. Их бизнес включает не только добычу существующих данных, но и внимание к долгосрочному бизнесу по генерации данных. Компания формирует команды по обучению AI из экспертов в различных областях, чтобы предоставить более качественные данные для обучения AI моделей.
Два этапа обучения модели
Обучение модели делится на две части: предварительное обучение и дообучение.
Предварительное обучение, аналогичное процессу, через который проходят человеческие младенцы, когда учатся говорить, требует ввода в модель ИИ большого количества текстов, кода и другой информации, собранной из Интернета, чтобы модель могла самостоятельно освоить основные навыки общения.
Финетюнинг аналогичен учебе, обычно есть четкие правильные и неправильные ответы, а также направление. Разные "школы" будут воспитывать "таланты" с разными характеристиками. Мы используем некоторые тщательно подготовленные, целенаправленные наборы данных, чтобы наделить модель необходимыми нам способностями.
Таким образом, нам нужны два типа данных:
Обширные данные, которые не требуют значительной обработки, в основном поступают из данных пауков крупных платформ UGC, открытых баз данных литературы, частных баз данных предприятий и т.д.
Специально разработанные и отобранные профессиональные наборы данных требуют работы по очистке данных, отбору, аннотации, обратной связи от пользователей и т.д.
Эти два типа наборов данных составляют основу AI Data трека. В настоящее время считается, что с постепенным исчезновением преимуществ вычислительной мощности данные станут ключевым фактором для производителей крупных моделей в поддержании конкурентоспособности.
С повышением способности модели разнообразные более тонкие и профессиональные тренировочные данные станут ключевыми факторами, определяющими способности модели. Если сравнить обучение модели с подготовкой мастера боевых искусств, то качественный набор данных — это лучший учебник по боевым искусствам.
В долгосрочной перспективе AI Data является долгосрочной нишей с эффектом снежного кома. С накоплением первоначальных работ данные активы будут иметь способность к сложным процентам, а их ценность будет расти с течением времени.
Web3 DataFi: Идеальная почва для AI данных
По сравнению с традиционными компаниями по обработке данных, Web3 обладает естественными преимуществами в области AI-данных, что привело к появлению концепции DataFi.
В идеале, преимущества Web3 DataFi включают в себя:
Для обычных пользователей DataFi — это самый простой децентрализованный AI проект для участия. Пользователям достаточно просто войти в кошелек, чтобы участвовать в нем, выполняя различные задачи, такие как предоставление данных, оценка моделей, использование AI инструментов для простого творчества, участие в торговле данными и т.д.
Потенциальные проекты Web3 DataFi
В настоящее время несколько проектов DataFi получили крупное финансирование, ниже приведены некоторые из представительных проектов:
Эти проекты в настоящее время имеют общие низкие барьеры, но с накоплением пользователей и экосистемной привязанности преимущества платформы быстро сформируются. Ранние проекты должны сосредоточиться на стимульных мерах и пользовательском опыте, чтобы привлечь достаточное количество пользователей.
В то же время этим платформам необходимо обратить внимание на то, как управлять человеческими ресурсами, обеспечивать качество данных и избегать явления "плохие деньги вытесняют хорошие", вызванного "помощниками". Некоторые проекты, такие как Sahara и Sapien, уже начали подчеркивать качество данных и стремятся установить долгосрочные и здоровые отношения с пользователями платформы.
Кроме того, повышение прозрачности является одной из текущих проблем, с которыми сталкиваются проекты на блокчейне. Многие проекты все еще должны ускорить шаги к открытости и прозрачности, чтобы способствовать долгосрочному здоровому развитию Web3 DataFi.
Масштабное принятие DataFi необходимо продвигать с двух сторон: во-первых, привлечь достаточное количество индивидуальных пользователей для участия в сборе/генерации данных, чтобы сформировать потребительскую группу для ИИ-экономики; во-вторых, получить признание от основных компаний, поскольку в краткосрочной перспективе они являются основным источником крупных объемов данных.
Заключение
С одной стороны, DataFi - это использование человеческого интеллекта для долгосрочного обучения машинного интеллекта, при этом через смарт-контракты гарантируется доход от человеческого интеллектуального труда, в конечном итоге наслаждаясь вознаграждением от машинного интеллекта.
Для тех, кто испытывает неопределенность в эпоху ИИ или все еще сохраняет идеалы в области блокчейна, следовать за капитальными магнатами и погружаться в DataFi является разумным выбором.