Voice alias — различия между версиями

Материал из База знаний
Перейти к: навигация, поиск
(Использование)
Строка 52: Строка 52:
  
 
Сначала Вы должны установить программу распознавания голоса. Если Вы используете Windows XP, скачайте и установите Speech SDK 5.1 с [http://www.microsoft.com/downloads/details.aspx?FamilyID=5e86ec97-40a7-453f-b0ee-6583171b4530&displaylang=en сайта Microsoft]. Вам нужен SpeechSDK51.exe (около 70 MB). Если Вы используете Windows Vista или Windows 7, то у Вас уже должна быть установлена программа распознавания речи.
 
Сначала Вы должны установить программу распознавания голоса. Если Вы используете Windows XP, скачайте и установите Speech SDK 5.1 с [http://www.microsoft.com/downloads/details.aspx?FamilyID=5e86ec97-40a7-453f-b0ee-6583171b4530&displaylang=en сайта Microsoft]. Вам нужен SpeechSDK51.exe (около 70 MB). Если Вы используете Windows Vista или Windows 7, то у Вас уже должна быть установлена программа распознавания речи.
 +
  
 
'''Настройка EuroScope'''
 
'''Настройка EuroScope'''
 +
 +
In EuroScope open the voice setup dialog. In the bottom you can find the Voice Alias grammar. Put your grammar file name here and press the Enable voice alias recognition check box. You may have the message dialog popping up with all the problems in your grammar file. Fix and reload it again. You do not have to leave EuroScope to change the grammar.
 +
 +
If the grammar file is OK, you can press the Test grammar button and start talking the words immediately. Say all the words, test if the engine recognizes well. Where are the problematic words? Try adding sounds like statements to make it more stable. And of course test all your sentences again and again. Be patient. To build up a usable grammar file needs some time to practice. You can test your grammar without speaking. Just edit the content of the source edit box to see what sentence is recognized (see the next chapter about it).
 +
 +
 +
'''Use it in EuroScope'''
 +
 +
When the voice alias recognition is enabled you can use it in the following way:
 +
 +
* Press the primary PTT button. I expect to say the callsign of the text aircraft (I do suggest trying to recognize it).
 +
 +
* Then while the primary PTT is down, press the secondary PTT simultaneously. That will switch on the recognition engine (and will not connect the secondary devices to the mike). When enabled, the bottom line (prompt and message line) is hidden and two new read-write edit boxes are shown there. They are both empty.
 +
 +
* When you are talking the recognized words are put to the first edit box each after the other with space separated. In the right place you can see the so far best matching alias. The matched words are shown without any sign, the sounds like matches are flagged by {} around, while the non matches are flagged by [].
 +
 +
* When ready you can release the secondary PTT button. You can go and manually edit any of the edit boxes. If you change the input edit, then for every keystroke the content is analyzed for a better sentence match. Here you can use the replacement strings too (e.g. press just 2 instead of two, or A instead of alpha).
 +
 +
* If the result is OK, the press ENTER to copy the result to the command line. Or if you press the secondary PTT again (when the result edit box is not empty) then the content is copied to the command editor and a new sentence is going to be recognized. This can be used when multiple sentences are to be sent to the plane.
 +
 +
* Send the text message in the original normal way to the plane.
 +
 +
'''ESGrammar.txt'''
 +
 +
Файл ESGrammar.txt сделаный Gergely Csernak находится в папке Settings. Он настроен под голос его создателя, но очевидно требует индивидуальной адаптации для каждого пользователя. Теперь, управлять пилотам с помощью текста, наверное. станет более удобно!
  
 
== Примечания ==
 
== Примечания ==

Версия 16:50, 9 января 2010

как, используя голосовое распознавание, управлять пилотами, работающими только текстом


Про голосовой алиас[1]

Управлять только текстовыми пилотами - проблема. EuroScope позволяет использовать текстовые алиас для быстрого создания автоматических сообщений. Но даже так, связь с пилотами текстом требует дополнительного времени. Но, наверно наибольшая проблема, что другие пилоты и не подозревают, что Вы составляете кому-то текстовое сообщение, и тишина на голосовом канале именно поэтому, а не потому что Вы ждете вызова на голосовом канале.

Поиск решения это проблемы длился долго. Решением стало использование системы распознавания голосом - мы что-то говорим, а в результате формируется текстовое сообщение. Но, к сожалению, современные технологии распознавания голоса далеки от идеала: они распознают много слов, но допускают и много ошибок. Как правило, эффективность достигает 70-80%. Это меньше чем нам необходимо. Некоторые слова системы совсем не распознают, а без этого не получится УВД.

Чтобы улучшить качество распознавания было решено уменьшить количество и фраз, которые должны распознаваться. Для этого был создан простой словарик (включающий и постоянные лингвистические конструкции). Вы можете описать слова, элементы один-из (one-of), повторы, выражения и (наверно наиболее удобное) звуки подобные выражениям. Из этих блоков Вы должны создать конструкции. И они станут алисами. EuroScope постарается распознать именно эти выражения и ничего больше. Конечное текстовое сообщение может быть только одним из выражений что Вы описали.

Структура файла словаря (grammar file)

Как и другие файлы настроек EuroScope, это файл является обычным текстовым в котором каждая строка содержит законченное выражение.


Слова

Базовым элементом голосового алиаса являются слова. Вы должны указать все слова, которые будете использовать в своем алиасе. Это поможет при распознание голоса, так как только среди этих слов будет вестись поиск. Никакое слово тут не описанное никогда не будет распознано.

Есть два типа описания слов:

1. Простой: просто описание слов

WORD:approach
WORD:runway
WORD:squawk
WORD:land
WORD:takeoff
WORD:taxi

2. Слова с заменой: если будет распознано такое слово, то в текстовую строку будет вписана его замена. Для того чтобы слово и выражение было с пробелами, необходимо в выражении, которое заменяет, поставить пробелы.

В таком случае "victor echo bravo oscar sierra" будет отображено как "VEBOS", "squawk two six two two" будет отображено как "squawk 2622". Также "one thousand" будет "1000", "five hundred" - "500". В компиляторе есть только одна дополнительная особенность: "seven thousand five hundred" будет отображено как "7500", если слово "hundred" распознано.

WORD:zero:0
WORD:one:1
WORD:two:2
WORD:alpha:A
WORD:bravo:B
WORD:charlie:C
WORD:thousand:000
WORD:hundred:00
WORD:direct: proceed direct :

(последнее всего лишь хитрость, так как слово "proceed" не распознается системой. Придется произносить слово "direct", чтоб оно заменялось на "proceed direct")

Использование

Microsoft Speech Recognition engine (программа распознавания речи от Microsoft)

Сначала Вы должны установить программу распознавания голоса. Если Вы используете Windows XP, скачайте и установите Speech SDK 5.1 с сайта Microsoft. Вам нужен SpeechSDK51.exe (около 70 MB). Если Вы используете Windows Vista или Windows 7, то у Вас уже должна быть установлена программа распознавания речи.


Настройка EuroScope

In EuroScope open the voice setup dialog. In the bottom you can find the Voice Alias grammar. Put your grammar file name here and press the Enable voice alias recognition check box. You may have the message dialog popping up with all the problems in your grammar file. Fix and reload it again. You do not have to leave EuroScope to change the grammar.

If the grammar file is OK, you can press the Test grammar button and start talking the words immediately. Say all the words, test if the engine recognizes well. Where are the problematic words? Try adding sounds like statements to make it more stable. And of course test all your sentences again and again. Be patient. To build up a usable grammar file needs some time to practice. You can test your grammar without speaking. Just edit the content of the source edit box to see what sentence is recognized (see the next chapter about it).


Use it in EuroScope

When the voice alias recognition is enabled you can use it in the following way:

  • Press the primary PTT button. I expect to say the callsign of the text aircraft (I do suggest trying to recognize it).
  • Then while the primary PTT is down, press the secondary PTT simultaneously. That will switch on the recognition engine (and will not connect the secondary devices to the mike). When enabled, the bottom line (prompt and message line) is hidden and two new read-write edit boxes are shown there. They are both empty.
  • When you are talking the recognized words are put to the first edit box each after the other with space separated. In the right place you can see the so far best matching alias. The matched words are shown without any sign, the sounds like matches are flagged by {} around, while the non matches are flagged by [].
  • When ready you can release the secondary PTT button. You can go and manually edit any of the edit boxes. If you change the input edit, then for every keystroke the content is analyzed for a better sentence match. Here you can use the replacement strings too (e.g. press just 2 instead of two, or A instead of alpha).
  • If the result is OK, the press ENTER to copy the result to the command line. Or if you press the secondary PTT again (when the result edit box is not empty) then the content is copied to the command editor and a new sentence is going to be recognized. This can be used when multiple sentences are to be sent to the plane.
  • Send the text message in the original normal way to the plane.

ESGrammar.txt

Файл ESGrammar.txt сделаный Gergely Csernak находится в папке Settings. Он настроен под голос его создателя, но очевидно требует индивидуальной адаптации для каждого пользователя. Теперь, управлять пилотам с помощью текста, наверное. станет более удобно!

Примечания

  1. алиас = alias - сокращенное выражение более длинного утверждения (что-то вроде его клички). К примеру, "взлет разрешаю", может быть выражено алиасом "вр", а "работайте с Киев Радар на частоте 133.050" - "ркр"