Будь ласка, використовуйте цей ідентифікатор, щоб цитувати або посилатися на цей матеріал:
https://er.knutd.edu.ua/handle/123456789/27085
Назва: | Особливості застосування систем розпізнавання об’єктів у режимі реального часу на мікроконтролерах з подальшим голосовим виводом інформації для людей з вадами зору |
Інші назви: | Peculiarities of application of object recognation system in real time on microcontrollers with subsequent voise output of information for people with visual impairments |
Автори: | Денісов, Р. В. Попович, П. В. |
Ключові слова: | системи розпізнавання зображень мікроконтролери голосовий вивід інформації згорткові нейронні мережі image recognition systems microcontrollers voice output of information convolutional neural networks TensorFlow English eSpeak MobileNet |
Дата публікації: | 2024 |
Бібліографічний опис: | Денісов Р. В. Особливості застосування систем розпізнавання об’єктів у режимі реального часу на мікроконтролерах з подальшим голосовим виводом інформації для людей з вадами зору [Текст] / Р. В. Денісов, П. В. Попович // Технології та інжиніринг. - 2024. - № 3 (20). - С. 21-30. |
Source: | Технології та інжиніринг |
Короткий огляд (реферат): | Дослідження мінімального і максимального часу необхідного на проходження одного повного циклу розпізнавання-оголошення назви об’єкту з урахуванням різної довжини слів, різної швидкості розпізнавання об’єктів, а також фізичних особливостей людей з вадами зору для систем розпізнавання об’єктів у режимі реального часу на мікроконтролерах з подальшим голосовим виводом. Створення варіантів комбінацій слів різної довжини з урахуванням можливості задання швидкості генерації мови у Espeak, та середньої швидкості мови в Україні. Розрахунок мінімальної і максимальної відстані до об’єкту на момент початку циклу розпізнавання-оголошення. Встановлено мінімальний і максимальний час необхідний на повний цикл розпізнавання-оголошення назви об’єкту. На базі синтезатора мови Espeak та особливостях Українсько мови та мовлення було досліджено час необхідний для оголошення назв об’єктів різної довжини. Встановленого мінімальний та максимальний час проходження повного циклу розпізнавання-оголошення інформації з урахуванням фізичних особливостей людей з вадами зору, швидкості їх руху та швидкості реакції на голосову інформацію. Також отримано мінімальну і максимальну відстань до об’єкту на момент початку циклу, в залежності від часу необхідного на проходження одного повного циклу. Отримано мінімальний і максимальний час необхідний на проходження повного циклу розпізнавання-оголошення інформації з урахуванням фізичних особливостей людей з вадами зору, технічних можливостей сучасних нейронних мереж та програм для синтезу мови, а також мінімальну і максимальну відстань до об’єкту на момент початку циклу. Досліджено мінімальну і максимальну відстань до об’єкту на момент початку циклу розпізнавання-оголошення. Отримані результати можуть бути використані при практичному створенні систем онлайн розпізнавання об’єктів, для оцінки можливості застосування тих чи інших нейронних мереж, спираючись на отриманий мінімальний та максимальний час проходження повного циклу розпізнавання-оголошення інформації, а також часу необхідного для проходження кожного з його окремих елементів. The study of the minimum and maximum time required to complete one full cycle of object name recognition-announcement taking into account different word lengths, different object recognition speeds, as well as physical characteristics of visually impaired people for real-time object recognition systems on microcontrollers with subsequent voice output. Creating variants of combinations of words of different lengths, taking into account the possibility of setting the speed of speech generation in Espeak, and the average speed of speech in Ukraine. Calculation of the minimum and maximum distance to the object at the start of the recognition-announcement cycle. The minimum and maximum time required for a full cycle of object name recognition-announcement is set. On the basis of the Espeak language synthesizer and the peculiarities of the Ukrainian language and speech, the time required to announce the names of objects of different lengths was investigated. The minimum and maximum time for completing the full cycle of information recognition-announcement is set, taking into account the physical characteristics of people with visual impairments, their speed of movement and the speed of reaction to voice information. The minimum and maximum distance to the object at the start of the cycle was also obtained, depending on the time required to complete one complete cycle. The minimum and maximum time needed to complete the full cycle of information recognition and announcement was obtained, taking into account the physical characteristics of visually impaired people, the technical capabilities of modern neural networks and programs for speech synthesis, as well as the minimum and maximum distance to the object at the time of the start of the cycle. The minimum and maximum distance to the object at the start of the recognition-announcement cycle was studied. The obtained results can be used in the practical creation of online object recognition systems, to assess the possibility of using certain neural networks, based on the obtained minimum and maximum time for passing the complete cycle of recognition-announcement of information, as well as the time required for passing each of its separate elements. |
DOI: | 10.30857/2786-5371.2024.3.2 |
URI (Уніфікований ідентифікатор ресурсу): | https://er.knutd.edu.ua/handle/123456789/27085 |
ISSN: | 2786-5371 |
Розташовується у зібраннях: | Наукові публікації (статті) Технології та інжиніринг |
Файли цього матеріалу:
Файл | Опис | Розмір | Формат | |
---|---|---|---|---|
TI_2024_N3(20)_P021-030.pdf | 534,71 kB | Adobe PDF | Переглянути/Відкрити |
Усі матеріали в архіві електронних ресурсів захищені авторським правом, всі права збережені.