-
AI/: Содержит файлы, связанные с искусственным интеллектом и обработкой данных.
- cleaned_books_dataset.csv: Созданный датасет.
- createDataSets.py: Скрипт для сбора данных и их обработки.
- datasets_cleaner.py: Скрипт для чтения и очистки данных.
- modelAPI.py: API для обращения к модели.
- TrainModel.ipynb: Jupyter Notebook с кодом и описанием обучения нейросети и примерами работы.
-
Android/: Приложение для Android устройств.
-
IOS/: Приложение под iPhone.
-
Tg_bot/: Содержит файлы для телеграмм бота.
- main.py: Основной файл телеграмм бота.
Этот код представляет собой реализацию многозадачного обучения на основе модели T5. Он создан для тренировки модели на различных задачах, таких как суммаризация, перевод, парафразирование и генерация вопросов. Основная цель - научить модель суммаризировать различный текст, разной уровни сложности.
- Откройте Jupyter ноутбук в Google Colab(Ссылка на блокнот с моделью)
- Запустите блок "Первоначальная настройка" для настройки окружения.
- Запустите блок "Пример суммаризации" и в последнем элименте взаимодействуйте с моделью в качестве консольного приложения
-
Многозадачное обучение
Был выбран подход многозадачного обучения, чтобы модель могла улучшать производительность на одной задаче за счёт знаний, полученных на другой. В коде данные для каждой задачи помечены специальными токенами, и они подаются в случайном порядке. Это позволяет модели контекстуально адаптироваться к каждой задаче и повышает её обобщающую способность.
-
Маленькие батчи и накопление градиентов
Одной из проблем при работе с большими моделями на ограниченной памяти является размер батча. В этом коде используется batch_size = 2, что снижает требования к памяти. Однако для обеспечения стабильного обучения используется накопление градиентов с accumulation_steps = 32.
-
Оптимизатор Adam
Для обновления весов используется Adam — адаптивный метод градиентного спуска. Он автоматически настраивает темпы обучения для каждого параметра на основе его текущего состояния и предыдущих шагов. Adam, как правило, хорошо подходит для обработки текстов, так как стабильно и быстро сходится, помогая эффективно решать задачи NLP.
протестировать можно по ссылке Google Colab
Это приложение для Android предназначено для чтения книг и взаимодействия с нейросетью, чтобы улучшить читательский опыт. Основная цель приложения — создать комфортную и эффективную среду для чтения, делая процесс более удобным и занимательным для запоминания текстка
- Интуитивно понятный интерфейс: Приложение разработано с акцентом на удобство пользователя, используя принципы Material Design, что обеспечивает простую навигацию и привлекательный визуальный стиль.
- Компоненты Jetpack Compose: Для создания UI использованы современные компоненты Jetpack Compose, что позволяет гибко управлять интерфейсом и быстро внедрять изменения.
- Интерактивные функции: Приложение включает в себя интерактивные элементы, такие как возможность выделять текст, добавлять заметки и получать краткие аннотации, что делает процесс чтения более вовлеченным.
- Обработка текста и анализ: Использование нейросети для анализа текста помогает улучшить понимание содержания, генерируя обобщения или ответы на вопросы, связанные с прочитанным.
- Поддержка различных форматов: Приложение поддерживает различные форматы книг, что обеспечивает широкие возможности для чтения и доступа к контенту.
В процессе разработки
Это приложение для iOS предназначено для чтения книг и взаимодействия с нейросетью, чтобы улучшить читательский опыт. Основная цель приложения — создать комфортную и эффективную среду для чтения, делая процесс более удобным и запоминающимся.
Основные идеи и подходы
- Интуитивно понятный интерфейс: Приложение разработано с акцентом на удобство пользователя, используя принципы Human Interface Guidelines от Apple, что обеспечивает простую навигацию и привлекательный визуальный стиль.
- SwiftUI: Для создания пользовательского интерфейса использованы современные компоненты SwiftUI, что позволяет гибко управлять дизайном и быстро внедрять изменения.
- Интерактивные функции: Приложение включает интерактивные элементы, такие как возможность выделять текст, добавлять заметки и получать краткие аннотации, что делает процесс чтения более вовлеченным и динамичным.
- Обработка текста и анализ: Использование нейросети для анализа текста помогает улучшить понимание содержания, генерируя обобщения или ответы на вопросы, связанные с прочитанным.
- Поддержка различных форматов: Приложение поддерживает различные форматы книг, что обеспечивает широкие возможности для чтения и доступа к контенту.
В процессе разработки
Этот бот создан для взаимодействия пользователей с моделью ИИ, предоставляя удобный интерфейс и комфортную среду для общения. Основная цель бота — упростить доступ к функционалу модели, делая взаимодействие с ней интуитивно понятным и эффективным.
- Интуитивно понятный интерфейс: Бот разработан с акцентом на удобство пользователя, что обеспечивает простое взаимодействие и быструю навигацию по командам.
- Использование aiogram: Для реализации бота использована библиотека aiogram, что позволяет создавать асинхронные и отзывчивые интерфейсы, обеспечивая высокую производительность и стабильность работы.
- Собственное API: Бот взаимодействует с моделью ИИ через собственное API, что позволяет гибко управлять запросами и получать результаты в реальном времени.
- Поддержка различных форматов: Бот поддерживает работу с множеством форматов файлов, а также возможность ввода текста через сообщения, что делает его универсальным инструментом для пользователей.
@podelu_sir_bot (не запущен, т.к. нет сервера)