Algorithme phonétique

Un article de Wikipédia, l'encyclopédie libre.

Un algorithme phonétique est un algorithme conçu pour indexer les mots selon leur prononciation. La plupart des algorithmes phonétiques sont développés pour être utilisé avec la langue anglaise ; par conséquent appliquer les règles de ces algorithmes à d’autres langues ne devrait pas donner de résultats compréhensibles.

Ils sont par nécessité complexes, avec de nombreuses règles et exceptions, car les langues et prononciations sont complexes de par les changements historiques dans la prononciation des mots et aux emprunts de diverses langues.

Parmi les algorithmes phonétiques les plus connus on peut citer :

Soundex, lequel a été développé pour coder des noms propres. Les codes Soundex sont des chaînes de quatre caractères composées d'une lettre suivie de trois chiffres.
Daitch-Mokotoff Soundex, lequel est une amélioration de Soundex afin de mieux correspondre aux noms propres d’origines slaves et yiddish. Les codes Daitch-Mokotoff Soundex sont des chaînes de caractères composées de six chiffres.
Metaphone et Double Metaphone, qui convient le mieux avec la plupart des mots anglais, français et pour d’autres langues au lieu uniquement des noms propres. Les algorithmes Metaphone servent de base à la majorité des correcteurs orthographiques.
Miracode
New York State Identification and Intelligence System (NYSIIS), lequel fait correspondre les phonèmes similaires à la même lettre. Le résultat est une chaîne de caractères qui peut être prononcée par le lecteur sans décodage.

[modifier] Voir aussi

[modifier] Liens internes

[modifier] Liens externes

(en) Project Dedupe

Catégories : Algorithme | Phonétique

Views

Contribuer

Rechercher

Autres langues

Powered by MediaWiki

Wikimedia Foundation

Cette page a été modifiée pour la dernière fois le 16 octobre 2007 à 18:19 par Utilisateur Louperibot. Basé sur le travail de Utilisateur(s) Le Pied-bot, CheepnisAroma et Richieman.
Droit d'auteur : Tous les textes sont disponibles sous les termes de la licence de documentation libre GNU (GFDL).
Wikipedia® est une marque déposée de la Wikimedia Foundation, Inc., organisation de bienfaisance régie par le paragraphe 501(c)(3) du code fiscal des États-Unis.
À propos de Wikipédia
Avertissements

web counter

Wikipedia HTML 2008 in other languages

100 000 +

Česká (Czech) • English • Deutsch (German) • 日本語 (Japanese) • Français (French) • Polski (Polish) • Suomi (Finnish) • Svenska (Swedish) • Nederlands (Dutch) • Español (Spanish) • Italiano (Italian) • Norsk (Norwegian Bokmål) • Português (Portuguese) • Română (Romanian) • Русский (Russian) • Türkçe (Turkish) • Українська (Ukrainian) • 中文 (Chinese)

10 000 +

العربية (Arabic) • Български (Bulgarian) • Bosanski (Bosnian) • Català (Catalan) • Cymraeg (Welsh) • Dansk (Danish) • Ελληνικά (Greek) • Esperanto • Eesti (Estonian) • Euskara (Basque) • Galego (Galician) • עברית (Hebrew) • हिन्दी (Hindi) • Hrvatski (Croatian) • Magyar (Hungarian) • Ido • Bahasa Indonesia (Indonesian) • Íslenska (Icelandic) • Basa Jawa (Javanese) • 한국어 (Korean) • Latina (Latin) • Lëtzebuergesch (Luxembourgish) • Lietuvių (Lithuanian) • Latviešu (Latvian) • Bahasa Melayu (Malay) • Plattdüütsch (Low Saxon) • Norsk (Norwegian Nynorsk) • فارسی (Persian) • Sicilianu (Sicilian) • Slovenčina (Slovak) • Slovenščina (Slovenian) • Српски (Serbian) • Basa Sunda (Sundanese) • தமிழ் (Tamil) • ไทย (Thai) • Tiếng Việt (Vietnamese)

1 000 +

Afrikaans • Asturianu (Asturian) • Беларуская (Belarusian) • Kaszëbsczi (Kashubian) • Frysk (Western Frisian) • Gaeilge (Irish) • Interlingua • Kurdî (Kurdish) • Kernewek (Cornish) • Māori • Bân-lâm-gú (Southern Min) • Occitan • संस्कृत (Sanskrit) • Scots • Tatarça (Tatar) • اردو (Urdu) Walon (Walloon) • יידיש (Yiddish) • 古文/文言文 (Classical Chinese)

100 +

Nehiyaw (Cree) • словѣньскъ (Old Church Slavonic) • gutisk (Gothic) • ລາວ (Laos)