לינוקס

עשרת כלי זיהוי הדיבור המקור הפתוח הטובים ביותר עבור לינוקס

Top 10 Best Open Source Speech Recognition Tools

בית לינוקס עשרת כלי זיהוי הדיבור המקור הפתוח הטובים ביותר עבור לינוקס על ידימהדי חסן בלינוקס 3655 2

תוכן

  1. כלי זיהוי דיבור בקוד פתוח
    1. 1 נשאר
    2. 2. CMUSphinx
    3. 3. DeepSpeech
    4. 4. Wav2Letter ++
    5. 5. יוליוס
    6. 6. שמעון
    7. 7. מיקרופט
    8. 8. OpenMindSpeech
    9. 9. SpeechControl
    10. 10. Deepspeech.pytorch
    11. מסיימים מחשבות

דיבור הוא שיטה פופולרית וחכמה בזמן המודרני לביצוע אינטראקציה עם מכשירים אלקטרוניים. כידוע, קיימים כלים רבים לזיהוי דיבור בקוד פתוח בפלטפורמות שונות. מתחילת הטכנולוגיה הזו היא שופרה בו זמנית בהבנת הקול האנושי. זו הסיבה; היא העסיקה כעת הרבה אנשי מקצוע מבעבר. ההתקדמות הטכנית מספיק חזקה בכדי להבהיר את זה לאנשים הפשוטים.



כלי זיהוי דיבור בקוד פתוח


כלי זיהוי הקול בקוד פתוח אינו זמין הרבה כמו התוכנה האופיינית בה אנו משתמשים בחיי היומיום שלנו בפלטפורמת לינוקס. לאחר דרך ארוכה של מחקר, מצאנו עבורך כמה יישומים מצוינים עם תיאור קצר. בואו נסתכל על הנקודות למטה!

1 נשאר


קלדי היא סוג מיוחד של תוכנות לזיהוי דיבור, שהתחילו כחלק מפרויקט באוניברסיטת ג'ון הופקינס. ערכת כלים זו מגיעה עם עיצוב הניתן להרחבה וכתוב בשפת תכנות C ++. הוא מספק סביבה גמישה ונוחה למשתמשים שלה עם הרבה הרחבות לשיפור העוצמה של קלדי.





kaldi-Open Source זיהוי דיבור

תכונות ראויות לציון של קלדי



  • אפליקציית זיהוי קולי פתוח בחינם וגמישה, תחת רישיון Apache.
  • פועל במספר פלטפורמות, כולל GNU/Linux , BSD ו- Microsoft Windows.
  • מספק תמיכה להתקנה והגדרת היישום למערכת שלך.
  • מלבד מערכת זיהוי הדיבור, היא תומכת גם ברשתות עצביות עמוקות ובהתמרות לינאריות.

צא שמאלה

2. CMUSphinx


CMUS Sphinx מגיע עם קבוצה של מערכות מועשרות עם מספר חבילות שנבנו מראש הקשורות לזיהוי דיבור. זוהי תוכנית קוד פתוח, שפותחה באוניברסיטת קרנגי מלון. תקבל כלי זיהוי בלתי תלוי ברמקולים במספר שפות, כולל צרפתית, אנגלית, גרמנית, הולנדית ועוד.

cmusphinx- זיהוי קולי בקוד פתוח

תכונות ראויות לציון של CMUSphinx

  • זוהי מערכת זיהוי דיבור קלה לשימוש ומהירה עם ממשק ידידותי למשתמש.
  • מגיע עם עיצוב גמיש ומערכת יעילה, אפילו בפלטפורמות בעלות משאבים נמוכים.
  • מספק כלי אימון דגמים אקוסטיים באמצעות חבילת הספינקסטריין.
  • עוזר לבצע סוגים שונים של משימות באמצעות החבילות המועילות שלה, כולל איתור מילות מפתח, הערכת הגייה, יישור ועוד.
  • זהו כלי חוצה פלטפורמות התומך במערכות Windows ו- Linux כאחד.

קבל CMUSphinx

3. DeepSpeech


DeepSpeech הוא מנוע זיהוי דיבור בקוד פתוח להמרת הדיבור שלך לטקסט. זהו יישום חינמי של מוזילה. כדי להפעיל את פרויקט DeepSearch במכשיר שלך, תזדקק ל- Python 3.r ומעלה. כמו כן, הוא זקוק לקובץ סיומת Git, כלומר Git אחסון קבצים גדול. הוא משמש לגרסת קבצים גדולים בזמן שאתה מפעיל אותו למערכת שלך.

דיבור עמוק

תכונות ראויות לציון של DeepSpeech

  • DeepSpeech משתמשת במסגרת TensorFlow כדי להפוך את השינוי הקולי לנוח יותר.
  • הוא תומך ב- NVIDIA GPU, שעוזר לבצע מסקנות מהירות יותר.
  • אתה יכול להשתמש בהסקת DeepSearch בשלוש דרכים שונות; חבילת Python, חבילת Node.JS או לקוח שורת הפקודה.
  • בכל פעם שתרצה להפעיל תוכנה זו למערכת שלך, יהיה עליך להפעיל את הסביבה הווירטואלית באמצעות פקודת פייתון.
  • היא זקוקה לסביבת Linux או Mac כדי להפעיל יישום זה.

קבל את DeepSpeech

4. Wav2Letter ++


WavLetter ++ הוא כלי מודרני ופופולרי לזיהוי דיבור, שפותח על ידי צוות מחקר Facebook AI. זוהי עוד קוד פתוח תחת רישיון BCD. תוכנה זו לזיהוי קולי מהיר במיוחד נבנתה ב- C ++ והוצגה עם הרבה תכונות. הוא מספק את המתקן של דוגמנות שפות, תרגום מכונה, סינתזת דיבור ועוד למשתמשים שלו בסביבה גמישה.

תכונות ראויות לציון של Wav2Letter ++

  • הוא מכיל קהילה פעילה בפלטפורמות פופולריות כמו פייסבוק וקבוצת Google כדי לסייע למשתמשיה ברחבי העולם.
  • WavLetter ++ הוא ערכת כלים מהירה וגמישה המשתמשת בספריית טנסור ArrayFire ליעילות המרבית.
  • הוא מאפשר לך לעבוד עם מסגרת בעלת ביצועים גבוהים כמו wav2letter ++, שעוזרת לבצע מחקר מוצלח וכוונון מודלים.
  • כמו כן, הוא מספק תיעוד מלא באמצעות מדורי ההדרכה.
  • בתיקיית המתכונים תקבלו את המתכונים המפורטים של WSJ, Timit ו- Librispeech.

קבל Wav2Letter ++

5. יוליוס


יוליוס היא יחסית תוכנת זיהוי קולי קוד פתוח ישנה יותר שפותחה על ידי לי אקינובו. כלי זה נכתב בשפת התכנות C על ידי מפתחי מעבדת Kawahara, אוניברסיטת קיוטו. זהו יישום זיהוי דיבור בעל ביצועים גבוהים בעל אוצר מילים גדול. אתה יכול להשתמש בו בשפות אנגלית ויפנית כאחד. זה יכול להיות בחירה מצוינת אם אתה רוצה להשתמש בו למטרות אקדמיות ומחקר.

יוליוס

תכונות ראויות לציון של יוליוס

  • יוליוס הוא יישום שניתן להגדיר במיוחד שיכול להגדיר פרמטרי חיפוש שונים כדי לכוון את הביצועים שלו.
  • כלי זה מבוסס על אסטרטגיית 2-pass המספקת לך ביצועים בזמן אמת ואיכותיים.
  • זהו פרויקט חוצה פלטפורמות הפועל על מערכות לינוקס, BSD, Windows ו- Android.
  • משולב עם ג'וליאן, מנתח זיהוי מבוסס דקדוק.
  • מלבד תמיכה בדקדוק המבוסס על חוק, הוא מספק גם פלט גרף Word, ניקוד ביטחון, דחיית קלט מבוססת GMM ועוד הרבה מתקנים.

קבל את יוליוס

6. שמעון


סיימון מגיע עם תוכנה מודרנית וקלה לשימוש לזיהוי דיבור, שפותחה על ידי פיטר גראש. זוהי עוד קוד פתוח תחת הרישיון הציבורי הכללי של GNU. אתה רשאי להשתמש בסיימון הן במערכות לינוקס והן במערכות Windows. כמו כן, הוא מספק את הגמישות לעבודה עם כל שפה שתרצה.

זיהוי דיבור של קוד פתוח

תכונות ראויות לציון של סיימון

  • באמצעות המחשבון הנשלט על ידי הקול, סיימון מספק את המתקן לביצוע פעולות אריתמטיות שונות.
  • תואם עם סקייפ ואחרות תוכניות VOIP פופולריות להקים מערכת תקשורת קלה עם חברים וקרובי משפחה.
  • הוא מאפשר למשתמשים לצפות בהצגות שקופיות וסרטונים, הקשב למוסיקה ועוד עם כמה פקודות קוליות פשוטות.
  • כמו כן, זהו כלי חיוני בקריאת עיתונים וגלישה באינטרנט.

קבל את סיימון

7. מיקרופט


Mycroft מגיע עם עוזר קולי פתוח פתוח לשימוש קל להמרת קול לטקסט. הוא נחשב לאחד מכלי זיהוי הדיבור הפופולריים ביותר של לינוקס בזמן המודרני, שנכתב ב- Python. הוא מאפשר למשתמשים לנצל את הכלי הזה בצורה הטובה ביותר בפרויקט מדעי או ביישום תוכנה ארגונית. כמו כן, הוא יכול לשמש כעוזר מעשי שיכול לספר לך את השעה, התאריך, מזג האוויר ועוד.

תכונות ראויות לציון של Mycroft

  • משולב עם המדיה החברתית והפלטפורמות המקצועיות הפופולריות ביותר, כולל פייסבוק, Github, LinkedIn ועוד.
  • אתה יכול להריץ יישום זה בפלטפורמות תוכנה וחומרה שונות. זה יכול להיות שולחן עבודה או פאי פטל .
  • מלבד היותו עוזר קולי חכם, הוא מספק את המתקן של תקליט האודיו, למידת מכונה, ספריית תוכנה ועוד.
  • הוא מאפשר למשתמשים להמיר את השפה הטבעית לנתונים קריאים במכונה באמצעות Adapt, מנתח הכוונה של Mycroft.

קבל את מיקרופט

8. OpenMindSpeech


נאום פתוח הוא אחד הכלי החיוני לזיהוי דיבור של לינוקס, שמטרתו להמיר את הדיבור שלכם לטקסט בחינם. היא חלק מ- Open Mind Initiative ומפעילה את הפעולה שלה, במיוחד עבור מפתחים. תוכנית זו הוצגה עם שמות שונים כמו VoiceControl, SpeechInput ו- FreeSpeech לפני קבלת השם הנוכחי.

תכונות ראויות לציון של OpenMindSpeech

  • הוא משתמש בסביבת Overflow בפעולת הזיהוי הקולי כדי להפוך את היישומים המורכבים לגמישים.
  • Open Mind Speech תואם בעיקר לפלטפורמות מבוססות לינוקס ו- UNIX.
  • באמצעות האינטרנט, היא יכולה לאסוף נתוני דיבור מאזרחים אלקטרוניים, התורמים לנתונים גולמיים.

קבל את OpenMindSpeech

9. SpeechControl


בקרת דיבור היא אפליקציה לזיהוי דיבור חופשי, המתאימה לכל הפצת אובונטו. הוא מגיע עם ממשק משתמש גרפי המבוסס על Qt. למרות שהוא עדיין בשלב הפיתוח המוקדם שלו, אתה יכול להשתמש בו לפרויקט הפשוט שלך.

בקרת דיבור-קוד פתוח זיהוי קולי

תכונות ראויות לציון של SpeechControl

  • בקרת דיבור היא תוכנית קוד פתוח תחת הרישיון הציבורי הכללי (GPL).
  • מטרתו היא לעבוד כעוזר וירטואלי המספק הדרכה חוזרת של משימות לביצוע התהליך בצורה חלקה.
  • הוא מתאים בעיקר לפלטפורמות מבוססות לינוקס.
  • כמו כן, מספק תיעוד משתמש קל להבנה עם פרטי הפרויקט.

קבל את SpeechControl

10. Deepspeech.pytorch


Deepspeech.pytorch היא אפליקציה נוספת לזיהוי דיבור בקוד פתוח, שזוכה בסופו של דבר ליישום DeepSpeech2 עבור PyTorch. הוא מכיל קבוצה של רשתות עוצמתיות המבוססות על אדריכלות DeepSpeech2. עם משאבים מועילים רבים, הוא יכול לשמש כאחד הכלים החיוניים לזיהוי דיבור של לינוקס למחקר ופיתוח פרויקטים.

תכונות ראויות לציון של Deepspeech.pytorch

  • תומך בהגדלת רעש המסייעת להגברת החוסן בזמן טעינת שמע.
  • כדי לשלוח את בקשת ההודעה לשרת, היא מספקת סקריפט שרת בסיסי.
  • תומך במספר מערכי נתונים להורדה, כולל TEDLIUM, AN4, Voxforge ו- LibriSpeech.
  • מאפשר להוסיף רעש לנתוני האימון באמצעות הזרקת רעש.
  • תומך ב- Visdom ו- Tensorboard להדמיית אימונים בניסויים מדעיים.

קבל Deepspeech.pytorch

מסיימים מחשבות


אז, הגענו לנקודת הסיום בכלים לזיהוי דיבור בקוד פתוח עבור לינוקס. מקווה שקיבלת מידע מקיף בנוגע לנושא זה. היישומים שהוזכרו לעיל הינם בחינם, קלים לשימוש ומוכנים להיות חלק מהפרויקט האקדמי או האישי שלך.

איזה מהם אתה הכי מעדיף? אם יש לך אפשרויות אחרות, אל תהסס ליידע אותנו.אנא שתף ​​מאמר זה עם הקהילה שלך, אם אתה עוזר בכך. עד אז, בכיף. תודה!

הפוך מספר שלילי לחיובי במצטיין
  • תגיות
  • תוכנת תקשורת
  • כלי פרודוקטיביות
לַחֲלוֹק פייסבוק טוויטר פינטרסט ווטסאפ ReddIt מִברָק Viber

    2 הערות

    1. דריוס 13 באוגוסט 2020 בשעה 20:40

      אני מרבה ליצור סרטוני לייב (בדרך כלל מוזרמים על ידי אינסטגרם או פייסבוק) והייתי רוצה לדעת אם יש תוכנה שיכולה לתמלל באופן אוטומטי את מה שאני אומר בסרטונים האלה, כמו יוטיוב עושה אוטומטית כתוביות. מישהו יכול לעזור? תודה

      תשובה
    2. קארל הנסון 22 במאי 2020 בשעה 23:53

      אני מחפש זיהוי דיבור פשוט ליצירת משתנה לבחירת קבצי שמע שישמשו לאדם עיוור. הגברת הזו רק רוצה להאזין לגרסה המקראית בשם The Message Bible. לרוע המזל הוא אינו זמין באופן שאינו מחייב את המשתמש להגיב לבחירות חזותיות.
      אני רואה בעיני רוחי קובץ שורת פקודה פשוט המופעל על ידי משתנה שנוצר על ידי קולה כשהיא אומרת משהו כמו גוטו ספר התהילים, פרק 23. (מכיוון שהתהילים מאונדסים על ידי תהילים הם יהיו בתוך תיקיות המסומנות כפרקים.

      תשובה

    השאר תגובה בטל תגובה

    הערה: אנא הכנס את תגובתך! שם:* אנא הכנס את שמך כאן דוא'ל:* הזנת כתובת דוא'ל שגויה! אנא הכנס את כתובת הדוא'ל שלך כאן אתר אינטרנט:

    שמור את שמי, כתובת הדוא'ל והאתר שלי בדפדפן זה בפעם הבאה שאגיב.

    נקודה_אימג

    הפרסום האחרון

    דְמוּי אָדָם

    10 אפליקציות החלפת הפנים הטובות ביותר למכשירי Android ו- iOS

    מערכת הפעלה של Windows

    כיצד לתזמן את Windows 10 לרוקן את סל המיחזור באופן אוטומטי

    דְמוּי אָדָם

    10 אפליקציות החיוב הטובות ביותר למכשיר אנדרואיד כדי לקבל תשלום מהיר

    מערכת הפעלה של Windows

    10 תוכנות ה- Benchmark Benchmark הטובות ביותר למחשב האישי שלך

    חייב לקרוא

    לינוקס

    20 משגרי יישומי לינוקס הטובים ביותר לשיפור הפרודוקטיביות שלך

    לינוקס

    כיצד להתקין ולהגדיר את TeamViewer באובונטו לינוקס

    לינוקס

    כיצד להתקין את לקוח הדוא'ל של Geary באובונטו. לקוח דוא'ל יפה ללינוקס

    לינוקס

    כיצד להתקין ולהגדיר את Sysstat בשולחן העבודה של Linux

    פוסט קשור

    כיצד להתקין ולהתקין את מסוף האינטרנט של תא הטייס במערכת Linux

    כיצד להתקין ולהגדיר Yii PHP Framework באובונטו לינוקס

    כיצד לתקן W: כמה קבצי אינדקס לא הורדו שגיאה ב- Ubuntu Linux

    כיצד להתקין ולהגדיר סיסמה 1 על שולחן העבודה של Linux

    כיצד להתקין את עורך הטקסט האחרון של GNU Nano בשולחן העבודה של Linux

    כיצד להתקין סוכן תשתיות שריד חדש במערכת לינוקס



    ^