Skip to content

Commit

Permalink
Added BOM to all related-text files (#526)
Browse files Browse the repository at this point in the history
  • Loading branch information
RichardSunMS authored Mar 2, 2020
1 parent 9ff8c23 commit 513c0d8
Show file tree
Hide file tree
Showing 9 changed files with 9 additions and 9 deletions.
2 changes: 1 addition & 1 deletion sampledata/customspeech/de-DE/training/related-text.txt
Original file line number Diff line number Diff line change
@@ -1,4 +1,4 @@
Inhalte wie Daten, Modelle, Tests und Endpunkte sind im Custom Speech-Portal in Projekten organisiert. Jedes Projekt ist für eine Domäne und das Land/die Sprache spezifisch. Folgen Sie den Anweisungen des Assistenten zum Erstellen Ihres Projekts. Nachdem Sie ein Projekt erstellt haben, sollten vier Registerkarten angezeigt werden: Daten, Test, Training und Bereitstellung.
Inhalte wie Daten, Modelle, Tests und Endpunkte sind im Custom Speech-Portal in Projekten organisiert. Jedes Projekt ist für eine Domäne und das Land/die Sprache spezifisch. Folgen Sie den Anweisungen des Assistenten zum Erstellen Ihres Projekts. Nachdem Sie ein Projekt erstellt haben, sollten vier Registerkarten angezeigt werden: Daten, Test, Training und Bereitstellung.
Über das Custom Speech-Portal können Sie hochgeladene Audiodaten wiedergeben und bestimmen, ob das angegebene Erkennungsergebnis korrekt ist. Mit diesem Tool können Sie schnell die Qualität des Baseline-Spracherkennungsmodells von Microsoft oder eines trainierten benutzerdefinierten Modells überprüfen, ohne Audiodaten transkribieren zu müssen.
Sobald der Test abgeschlossen ist, was durch den Statuswechsel zu Erfolgreich angezeigt wird, erhalten Sie eine WER-Nummer für beide Modelle in Ihrem Test.
In diesem Dokument erfahren Sie, wie Sie die Qualität des Spracherkennungsmodells von Microsoft oder Ihres benutzerdefinierten Modells quantitativ messen können. Zum Testen der Genauigkeit sind Audio- und menschenmarkierte Transkriptionsdaten erforderlich, und 30 Minuten bis 5 Stunden an repräsentativem Audio müssen bereitgestellt werden.
Expand Down
2 changes: 1 addition & 1 deletion sampledata/customspeech/en-US/training/related-text.txt
Original file line number Diff line number Diff line change
@@ -1,4 +1,4 @@
Content like data, models, tests, and endpoints are organized into Projects in the Custom Speech portal. Each project is specific to a domain and country/language. For example, you may create a project for call centers that use English in the United States. To create your first project, select the Speech-to-text/Custom speech, then click New Project. Follow the instructions provided by the wizard to create your project. After you've created a project, you should see four tabs: Data, Testing, Training, and Deployment. Use the links provided in Next steps to learn how to use each tab.
Content like data, models, tests, and endpoints are organized into Projects in the Custom Speech portal. Each project is specific to a domain and country/language. For example, you may create a project for call centers that use English in the United States. To create your first project, select the Speech-to-text/Custom speech, then click New Project. Follow the instructions provided by the wizard to create your project. After you've created a project, you should see four tabs: Data, Testing, Training, and Deployment. Use the links provided in Next steps to learn how to use each tab.
Custom Speech provides tools that allow you to visually inspect the recognition quality of a model by comparing audio data with the corresponding recognition result. From the Custom Speech portal, you can play back uploaded audio and determine if the provided recognition result is correct. This tool allows you to quickly inspect quality of Microsoft's baseline speech-to-text model or a trained custom model without having to transcribe any audio data.
In this document, you'll learn how to quantitatively measure the quality of Microsoft's speech-to-text model or your custom model. Audio + human-labeled transcription data is required to test accuracy, and 30 minutes to 5 hours of representative audio should be provided.
What is Word Error Rate (WER)?
Expand Down
2 changes: 1 addition & 1 deletion sampledata/customspeech/es-ES/training/related-text.txt
Original file line number Diff line number Diff line change
@@ -1,4 +1,4 @@
El contenido, como datos, modelos, pruebas y puntos de conexión, se organiza en proyectos en el portal de Custom Speech. Cada proyecto es específico de un dominio y un país o idioma. Por ejemplo, puede crear un proyecto para centros de llamadas que usan el inglés en Estados Unidos. Para crear su primer proyecto, seleccione Speech-to-text/Custom speech (Conversión de voz a texto/Conversión de voz personalizada) y, a continuación, haga clic en New project (Nuevo proyecto). Siga las instrucciones del asistente para crear el proyecto. Después de crear el proyecto, verá cuatro pestañas: Datos, Pruebas, Entrenamiento e Implementación. Use los vínculos incluidos en Pasos siguientes para aprender a usar cada pestaña.
El contenido, como datos, modelos, pruebas y puntos de conexión, se organiza en proyectos en el portal de Custom Speech. Cada proyecto es específico de un dominio y un país o idioma. Por ejemplo, puede crear un proyecto para centros de llamadas que usan el inglés en Estados Unidos. Para crear su primer proyecto, seleccione Speech-to-text/Custom speech (Conversión de voz a texto/Conversión de voz personalizada) y, a continuación, haga clic en New project (Nuevo proyecto). Siga las instrucciones del asistente para crear el proyecto. Después de crear el proyecto, verá cuatro pestañas: Datos, Pruebas, Entrenamiento e Implementación. Use los vínculos incluidos en Pasos siguientes para aprender a usar cada pestaña.
Custom Speech proporciona herramientas que le permiten inspeccionar visualmente la calidad del reconocimiento de un modelo mediante la comparación de los datos de audio con el resultado de reconocimiento correspondiente. Desde el portal de Custom Speech, puede reproducir el audio cargado y determinar si el resultado de reconocimiento proporcionada es correcto. Esta herramienta le permite inspeccionar rápidamente la calidad del modelo de voz a texto de línea de base de Microsoft o de un modelo personalizado entrenado sin tener que transcribir los datos de audio.
En este documento, aprenderá a medir cuantitativamente la calidad del modelo de conversión de texto a voz de Microsoft o su modelo personalizado. Para probar la voz se requieren datos de transcripción de con la etiqueta audio + humano, y se deben proporcionar entre 30 minutos y 5 horas de audio representativo.
¿Qué es Word Error Rate (WER)?
Expand Down
2 changes: 1 addition & 1 deletion sampledata/customspeech/fr-FR/training/related-text.txt
Original file line number Diff line number Diff line change
@@ -1,4 +1,4 @@
Le contenu que représentent les données, les modèles, les tests et les points de terminaison est organisé en projets sur le portail Custom Speech. Chaque projet est propre à un domaine et à un pays/langue. Par exemple, vous pouvez créer un projet pour des centres d’appel dont la langue est l’anglais des États-Unis. Pour créer votre premier projet, sélectionnez Speech-to-text/Custom speech, puis cliquez sur New Project. Suivez les instructions fournies par l’Assistant pour créer votre projet. Une fois le projet créé, vous devez disposer de quatre onglets: Data, Testing, Training et Deployment. Utilisez les liens fournis dans Étapes suivantes pour savoir comment utiliser chaque onglet.
Le contenu que représentent les données, les modèles, les tests et les points de terminaison est organisé en projets sur le portail Custom Speech. Chaque projet est propre à un domaine et à un pays/langue. Par exemple, vous pouvez créer un projet pour des centres d’appel dont la langue est l’anglais des États-Unis. Pour créer votre premier projet, sélectionnez Speech-to-text/Custom speech, puis cliquez sur New Project. Suivez les instructions fournies par l’Assistant pour créer votre projet. Une fois le projet créé, vous devez disposer de quatre onglets: Data, Testing, Training et Deployment. Utilisez les liens fournis dans Étapes suivantes pour savoir comment utiliser chaque onglet.
Custom Speech propose des outils qui vous permettent d’inspecter visuellement la qualité de la reconnaissance d’un modèle en comparant les données audio au résultat de la reconnaissance correspondante. À partir du portail Custom Speech, vous pouvez lire le contenu audio chargé et déterminer si le résultat proposé de la reconnaissance est correct. Cet outil vous permet d’inspecter rapidement la qualité du modèle de reconnaissance vocale de référence de Microsoft ou d’un modèle entraîné personnalisé sans qu’il soit nécessaire de transcrire des données audio.
Dans ce document, vous allez apprendre à quantifier la qualité du modèle de reconnaissance vocale de Microsoft ou de votre modèle personnalisé. Des données de transcription audio et étiquetées à la main sont nécessaires pour tester la précision ; il faut également fournir entre 30 minutes et 5 heures d’audio représentatif.
Qu’est-ce que le taux d'erreur de mots ?
Expand Down
2 changes: 1 addition & 1 deletion sampledata/customspeech/it-IT/training/related-text.txt
Original file line number Diff line number Diff line change
@@ -1,4 +1,4 @@
Contenuti come dati, modelli, test ed endpoint sono organizzati in progetti nel portale di riconoscimento vocale personalizzato. Ogni progetto è specifico per un dominio e un paese/lingua. Ad esempio, è possibile creare un progetto per i Call Center che usano la lingua inglese nella Stati Uniti. Per creare il primo progetto, selezionare la voce vocale /personalizzata, quindi fare clic su nuovo progetto. Seguire le istruzioni fornite dalla procedura guidata per creare il progetto. Dopo aver creato un progetto, verranno visualizzate quattro schede: Dati, test, Traininge distribuzione. Usare i collegamenti forniti nei passaggi successivi per informazioni su come usare ogni scheda.
Contenuti come dati, modelli, test ed endpoint sono organizzati in progetti nel portale di riconoscimento vocale personalizzato. Ogni progetto è specifico per un dominio e un paese/lingua. Ad esempio, è possibile creare un progetto per i Call Center che usano la lingua inglese nella Stati Uniti. Per creare il primo progetto, selezionare la voce vocale /personalizzata, quindi fare clic su nuovo progetto. Seguire le istruzioni fornite dalla procedura guidata per creare il progetto. Dopo aver creato un progetto, verranno visualizzate quattro schede: Dati, test, Traininge distribuzione. Usare i collegamenti forniti nei passaggi successivi per informazioni su come usare ogni scheda.
Riconoscimento vocale personalizzato offre strumenti che consentono di esaminare visivamente la qualità del riconoscimento di un modello confrontando i dati audio con il risultato del riconoscimento corrispondente. Dal portale di riconoscimento vocale personalizzatoè possibile riprodurre l'audio caricato e determinare se il risultato del riconoscimento fornito è corretto. Questo strumento consente di ispezionare rapidamente la qualità del modello di sintesi vocale di Microsoft o di un modello personalizzato sottoposto a training senza dover trascrivere dati audio.
In questo documento si apprenderà come misurare quantitativamente la qualità del modello di sintesi vocale di Microsoft o del modello personalizzato. Per il test dell'accuratezza sono necessari dati di trascrizione audio e con etichetta umana. è necessario fornire da 30 minuti a 5 ore di audio rappresentativo.
Che cos'è la frequenza degli errori di parola?
Expand Down
2 changes: 1 addition & 1 deletion sampledata/customspeech/ja-JP/training/related-text.txt
Original file line number Diff line number Diff line change
@@ -1,4 +1,4 @@
Custom Speech には、オーディオ データを対応する認識結果と比較することによって、モデルの認識品質を視覚的に検査するツールがあります。 Custom Speech ポータルから、アップロードされたオーディオを再生し、提供された認識結果が正しいかどうかを判断できます。 このツールを使用すると、オーディオ データを文字起こしすることなく、Microsoft のベースラインの音声変換モデルまたはトレーニング済みのカスタム モデルの品質をすばやく検査できます。
Custom Speech には、オーディオ データを対応する認識結果と比較することによって、モデルの認識品質を視覚的に検査するツールがあります。 Custom Speech ポータルから、アップロードされたオーディオを再生し、提供された認識結果が正しいかどうかを判断できます。 このツールを使用すると、オーディオ データを文字起こしすることなく、Microsoft のベースラインの音声変換モデルまたはトレーニング済みのカスタム モデルの品質をすばやく検査できます。
このドキュメントでは、Microsoft の音声テキスト変換モデルまたはカスタム モデルの品質を定量的に測定する方法を説明します。 正確性をテストするには、オーディオ + ヒューマン ラベル付け文字起こしデータが必要であり、30 分から 5 時間の典型的な音声を用意する必要があります。
ワード エラー率 (WER) とは
モデルの正確性を測定するための業界標準は、"ワード エラー率" (WER) です。 WER では、認識中に識別された誤った単語の数を数え、ヒューマン ラベル付けトランスクリプトで提供された単語の総数で割ります。 最後に、その数に 100% を掛けて WER を計算します。
Expand Down
2 changes: 1 addition & 1 deletion sampledata/customspeech/ko-KR/training/related-text.txt
Original file line number Diff line number Diff line change
@@ -1,4 +1,4 @@
데이터, 모델, 테스트 및 끝점같은 콘텐츠는 사용자 지정 음성 포털에서 프로젝트로 구성됩니다. 각 프로젝트는 도메인 및 국가/언어에만 적용 됩니다. 예를 들어 미국에서 영어를 사용하는 콜 센터에 대한 프로젝트를 만들 수 있습니다. 첫 번째 프로젝트를 만들려면 음성-텍스트/사용자 지정 음성 선택한 다음, 새 프로젝트를 클릭합니다. 프로젝트를 만들려면 마법사에서 제공하는 지침을 따릅니다. 프로젝트를 만든 후 4개 탭이 표시됩니다: 데이터, 테스트, 학습 및 배포. 각 탭을 사용하는 방법을 배우려면 다음 단계에서 제공되는 링크를 사용합니다.
데이터, 모델, 테스트 및 끝점같은 콘텐츠는 사용자 지정 음성 포털에서 프로젝트로 구성됩니다. 각 프로젝트는 도메인 및 국가/언어에만 적용 됩니다. 예를 들어 미국에서 영어를 사용하는 콜 센터에 대한 프로젝트를 만들 수 있습니다. 첫 번째 프로젝트를 만들려면 음성-텍스트/사용자 지정 음성 선택한 다음, 새 프로젝트를 클릭합니다. 프로젝트를 만들려면 마법사에서 제공하는 지침을 따릅니다. 프로젝트를 만든 후 4개 탭이 표시됩니다: 데이터, 테스트, 학습 및 배포. 각 탭을 사용하는 방법을 배우려면 다음 단계에서 제공되는 링크를 사용합니다.
사용자 지정 음성은 오디오 데이터와 해당 인식 결과를 비교하여 모델의 인식 품질을 시각적으로 검사할 수 있는 도구를 제공합니다. 사용자 지정 음성 포털에서 업로드된 오디오를 재생하고 제공된 인식 결과가 올바른지 결정할 수 있습니다. 이 도구를 사용하면 모든 오디오 데이터를 기록하지 않고도 학습된 사용자 지정 모델이나 Microsoft의 기본 음성-텍스트 모델의 품질을 신속하게 검사할 수 있습니다.
이 문서에서는 Microsoft의 음성-텍스트 모델 또는 사용자 지정 모델의 품질을 정량적으로 측정하는 방법을 알아봅니다. 오디오 + 사람 레이블 기록 데이터가 정확도를 테스트하는 데 필요하고 30분에서 5시간의 대표 오디오를 제공해야 합니다.
WER(Word Error Rate, 단어 오류율)이란?
Expand Down
2 changes: 1 addition & 1 deletion sampledata/customspeech/pt-BR/training/related-text.txt
Original file line number Diff line number Diff line change
@@ -1,4 +1,4 @@
Conteúdo como dados, modelos, testes e pontos de extremidade são organizados em projetos no portal de fala personalizada. Cada projeto é específico de um domínio e país/idioma. Por exemplo, você pode criar um projeto para centros de chamadas que usam o inglês no Estados Unidos. Para criar seu primeiro projeto, selecione a fala de fala para texto/Personalizadae clique em novo projeto. Siga as instruções fornecidas pelo Assistente para criar seu projeto. Depois de criar um projeto, você deverá ver quatro guias: Dados, teste, treinamentoe implantação. Use os links fornecidos nas próximas etapas para aprender a usar cada guia.
Conteúdo como dados, modelos, testes e pontos de extremidade são organizados em projetos no portal de fala personalizada. Cada projeto é específico de um domínio e país/idioma. Por exemplo, você pode criar um projeto para centros de chamadas que usam o inglês no Estados Unidos. Para criar seu primeiro projeto, selecione a fala de fala para texto/Personalizadae clique em novo projeto. Siga as instruções fornecidas pelo Assistente para criar seu projeto. Depois de criar um projeto, você deverá ver quatro guias: Dados, teste, treinamentoe implantação. Use os links fornecidos nas próximas etapas para aprender a usar cada guia.
Fala Personalizada fornece ferramentas que permitem inspecionar visualmente a qualidade de reconhecimento de um modelo, comparando dados de áudio com o resultado de reconhecimento correspondente. No portal de fala personalizada, você pode reproduzir áudio carregado e determinar se o resultado de reconhecimento fornecido está correto. Essa ferramenta permite que você inspecione rapidamente a qualidade do modelo de fala-para-texto de linha de base da Microsoft ou de um modelo personalizado treinado sem precisar transcrever os dados de áudio.
Neste documento, você aprenderá a medir de forma quantitativa a qualidade do modelo de fala-para-texto da Microsoft ou de seu modelo personalizado. Áudio e dados de transcrição com rótulo humano são necessários para testar a precisão e 30 minutos a 5 horas de áudio representativo devem ser fornecidos.
O que é a taxa de erros do Word (WER)?
Expand Down
2 changes: 1 addition & 1 deletion sampledata/customspeech/zh-CN/training/related-text.txt
Original file line number Diff line number Diff line change
@@ -1,4 +1,4 @@
数据、模型、测试和终结点等内容组织到自定义语音门户中的项目中。 每个项目都是特定于域和国家/地区的。 例如,你可以为在美国中使用英语的呼叫中心创建项目。 若要创建第一个项目,请选择 "语音到文本"/"自定义" 语音,然后单击 "新建项目"。 遵照向导中的说明创建项目。 创建项目后,应该会看到四个选项卡:数据、测试、培训和部署。 使用后续步骤中提供的链接了解如何使用每个选项卡。
数据、模型、测试和终结点等内容组织到自定义语音门户中的项目中。 每个项目都是特定于域和国家/地区的。 例如,你可以为在美国中使用英语的呼叫中心创建项目。 若要创建第一个项目,请选择 "语音到文本"/"自定义" 语音,然后单击 "新建项目"。 遵照向导中的说明创建项目。 创建项目后,应该会看到四个选项卡:数据、测试、培训和部署。 使用后续步骤中提供的链接了解如何使用每个选项卡。
自定义语音提供的工具可让你通过将音频数据与相应的识别结果进行比较,直观地检查模型的识别质量。 在自定义语音门户中,可以播放上传的音频,并确定所提供的识别结果是否正确。 使用此工具,可以快速检查 Microsoft 的基线语音到文本模型或定型自定义模型的质量,无需转录任何音频数据。
在本文档中,你将学习如何而言度量 Microsoft 的语音到文本模型或自定义模型的质量。 需要音频和人为标记的脚本数据来测试准确性,并且应提供30分钟到5小时的代表音频。
什么是 Word 错误率(WER)?
Expand Down

0 comments on commit 513c0d8

Please sign in to comment.