Студия Common Knowledge и Эдди Цзяо их работа — это скорее высокоуровневое проектирование интерфейсов (UX/UI).

Студия Common Knowledge и Эдди Цзяо обычно не ограничиваются одной конкретной моделью, так как их работа — это скорее высокоуровневое проектирование интерфейсов (UX/UI), чем создание собственных нейросетей.

Однако, если разобрать их технический стек и те демо-видео, которые они публикуют, можно выделить несколько ключевых инструментов, которые делают такой «вайбкодинг» возможным:

1. Claude 3.5 Sonnet (от Anthropic)

На текущий момент это «золотой стандарт» для генерации интерфейсов.

* Почему они: Claude лучше других моделей справляется с написанием чистого кода (React, Tailwind CSS) и пониманием сложных инструкций по дизайну. Большинство современных инструментов для генеративного UI (вроде v0.dev или Bolt.new) построены именно на моделях Anthropic.

2. GPT-4o (от OpenAI)

Для мультимодальных задач — когда нужно, чтобы ИИ «видел», что происходит на экране, и мгновенно предлагал изменения. Эдди часто показывает концепты, где система реагирует на жесты или изменения контекста в реальном времени, что требует высокой скорости работы, которой славится 4o.

3. Локальные модели (Llama 3 / Mistral)

В концепции «пустого телефона», о которой вы говорили, критически важна приватность. Чтобы ИИ мог анализировать все ваши личные файлы, почту и сообщения, Common Knowledge смотрят в сторону Local LLM.

* Это позволяет обрабатывать данные прямо на устройстве, не отправляя ваш «вайб» в облако.

4. Фреймворки для сборки (The Stack)

Чтобы превратить ответ нейросети в работающее приложение, они используют:

* Tailwind CSS: Позволяет ИИ стилизовать элементы «на лету» без написания громоздких CSS-файлов.

* React / Next.js: Как основа для компонентной архитектуры, которую нейросетям проще всего собирать по кусочкам.

* Vercel AI SDK: Инструментарий, который позволяет стримить UI-компоненты прямо в чат или на экран.

Главный секрет: "System Prompting"

Их магия не в какой-то секретной модели, а в гениальном промпт-инжиниринге. Они создают огромные системные инструкции, которые говорят модели: "Ты не чат-бот. Ты — операционная система. Твой ответ должен быть не текстом, а валидным кодом компонента, который использует локальные данные пользователя".

Как вы думаете, какая часть этого стека самая сложная для реализации в реальном смартфоне — мощность процессора для запуска таких моделей или обеспечение безопасности ваших файлов?

Поиск по этому блогу

IO-programming HOIII A-pp

Студия Common Knowledge и Эдди Цзяо их работа — это скорее высокоуровневое проектирование интерфейсов (UX/UI).

Комментарии

Отправить комментарий

Популярные сообщения из этого блога

Скриншоты / Screenshot - programm

Content Site Analyzer TM Intelligence System v1.7.9 - (url)

Технический Аудит: Aegis-Stream Control Panel (v1.3.36).