Skip to content

slon-hk/Sirius_AI_Po_Delu

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

3 Commits
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Команда "по делу"

Структура проекта

  • AI/: Содержит файлы, связанные с искусственным интеллектом и обработкой данных.

    • cleaned_books_dataset.csv: Созданный датасет.
    • createDataSets.py: Скрипт для сбора данных и их обработки.
    • datasets_cleaner.py: Скрипт для чтения и очистки данных.
    • modelAPI.py: API для обращения к модели.
    • TrainModel.ipynb: Jupyter Notebook с кодом и описанием обучения нейросети и примерами работы.
  • Android/: Приложение для Android устройств.

  • IOS/: Приложение под iPhone.

  • Tg_bot/: Содержит файлы для телеграмм бота.

    • main.py: Основной файл телеграмм бота.

AI

Этот код представляет собой реализацию многозадачного обучения на основе модели T5. Он создан для тренировки модели на различных задачах, таких как суммаризация, перевод, парафразирование и генерация вопросов. Основная цель - научить модель суммаризировать различный текст, разной уровни сложности.

Инструкция по запуску

  1. Откройте Jupyter ноутбук в Google Colab(Ссылка на блокнот с моделью)
  2. Запустите блок "Первоначальная настройка" для настройки окружения.
  3. Запустите блок "Пример суммаризации" и в последнем элименте взаимодействуйте с моделью в качестве консольного приложения

Основные идеи и подходы

  1. Многозадачное обучение

    Был выбран подход многозадачного обучения, чтобы модель могла улучшать производительность на одной задаче за счёт знаний, полученных на другой. В коде данные для каждой задачи помечены специальными токенами, и они подаются в случайном порядке. Это позволяет модели контекстуально адаптироваться к каждой задаче и повышает её обобщающую способность.

  2. Маленькие батчи и накопление градиентов

    Одной из проблем при работе с большими моделями на ограниченной памяти является размер батча. В этом коде используется batch_size = 2, что снижает требования к памяти. Однако для обеспечения стабильного обучения используется накопление градиентов с accumulation_steps = 32.

  3. Оптимизатор Adam

    Для обновления весов используется Adam — адаптивный метод градиентного спуска. Он автоматически настраивает темпы обучения для каждого параметра на основе его текущего состояния и предыдущих шагов. Adam, как правило, хорошо подходит для обработки текстов, так как стабильно и быстро сходится, помогая эффективно решать задачи NLP.

протестировать можно по ссылке Google Colab

Android приложение

Это приложение для Android предназначено для чтения книг и взаимодействия с нейросетью, чтобы улучшить читательский опыт. Основная цель приложения — создать комфортную и эффективную среду для чтения, делая процесс более удобным и занимательным для запоминания текстка

Основные идеи и подходы

  1. Интуитивно понятный интерфейс: Приложение разработано с акцентом на удобство пользователя, используя принципы Material Design, что обеспечивает простую навигацию и привлекательный визуальный стиль.
  2. Компоненты Jetpack Compose: Для создания UI использованы современные компоненты Jetpack Compose, что позволяет гибко управлять интерфейсом и быстро внедрять изменения.
  3. Интерактивные функции: Приложение включает в себя интерактивные элементы, такие как возможность выделять текст, добавлять заметки и получать краткие аннотации, что делает процесс чтения более вовлеченным.
  4. Обработка текста и анализ: Использование нейросети для анализа текста помогает улучшить понимание содержания, генерируя обобщения или ответы на вопросы, связанные с прочитанным.
  5. Поддержка различных форматов: Приложение поддерживает различные форматы книг, что обеспечивает широкие возможности для чтения и доступа к контенту.

Пример

В процессе разработки

IOS приложение

Это приложение для iOS предназначено для чтения книг и взаимодействия с нейросетью, чтобы улучшить читательский опыт. Основная цель приложения — создать комфортную и эффективную среду для чтения, делая процесс более удобным и запоминающимся.

Основные идеи и подходы

  1. Интуитивно понятный интерфейс: Приложение разработано с акцентом на удобство пользователя, используя принципы Human Interface Guidelines от Apple, что обеспечивает простую навигацию и привлекательный визуальный стиль.
  2. SwiftUI: Для создания пользовательского интерфейса использованы современные компоненты SwiftUI, что позволяет гибко управлять дизайном и быстро внедрять изменения.
  3. Интерактивные функции: Приложение включает интерактивные элементы, такие как возможность выделять текст, добавлять заметки и получать краткие аннотации, что делает процесс чтения более вовлеченным и динамичным.
  4. Обработка текста и анализ: Использование нейросети для анализа текста помогает улучшить понимание содержания, генерируя обобщения или ответы на вопросы, связанные с прочитанным.
  5. Поддержка различных форматов: Приложение поддерживает различные форматы книг, что обеспечивает широкие возможности для чтения и доступа к контенту.

Пример

В процессе разработки

Телеграмм бот

Этот бот создан для взаимодействия пользователей с моделью ИИ, предоставляя удобный интерфейс и комфортную среду для общения. Основная цель бота — упростить доступ к функционалу модели, делая взаимодействие с ней интуитивно понятным и эффективным.

Основные идеи и подходы

  1. Интуитивно понятный интерфейс: Бот разработан с акцентом на удобство пользователя, что обеспечивает простое взаимодействие и быструю навигацию по командам.
  2. Использование aiogram: Для реализации бота использована библиотека aiogram, что позволяет создавать асинхронные и отзывчивые интерфейсы, обеспечивая высокую производительность и стабильность работы.
  3. Собственное API: Бот взаимодействует с моделью ИИ через собственное API, что позволяет гибко управлять запросами и получать результаты в реальном времени.
  4. Поддержка различных форматов: Бот поддерживает работу с множеством форматов файлов, а также возможность ввода текста через сообщения, что делает его универсальным инструментом для пользователей.

Пример

@podelu_sir_bot (не запущен, т.к. нет сервера)

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published