Во многих языках используются диграфы или триграфы, то есть сочетания букв, обозначающие один звук. Однако в некоторые алфавиты вместо таких сочетаний были введены специальные символы (диакритики), которые добавляются к основным буквам алфавита для замены диграфов или триграфов одной буквой. Идея замены принадлежит чешскому мыслителю Яну Гусу, который первым предложил в 1411 году в трактате De Ortographia Bohemica использовать диакритики вместо буквенных сочетаний, тем самым упорядочив орфографию чешского языка. Далее вслед за чешским языком диакритики приняли некоторые другие центрально-европейские языки.
Однако не только европейские языки используют диакритические знаки. В греческом языке их применяли для выражения тональности, арабском и идише - для обозначения гласных, в индийской слоговой письменности - для изменения звучания слогов.
В языках, использующих латинскую письменность, диакритики являются прежде всего инструментом для расширения основного алфавита. Так, например, французский диграф "ch", английский "sh" или немецкий триграф "sch", обозначающие звук [ʃ], в ряде языков передается буквой š с надстрочным диграфом гачек. В большинстве случаев использование диакритиков в языках с латинским алфавитом было обусловлено невозможностью передать шипящие звуки, палатализованные или носовые гласные, присутствовавшие в других языках. Звукоразличительные диакритики широко представлены в алфавитах таких языков, как чешский, словацкий, румынский, польский, литовский, турецкий и вьетнамский.
По месту написания диакритики делятся на надстрочные, подстрочные и внутристрочные. В отдельных случаях с одной буквой могут одновременно употребляться не один, а два, три или редко четыре диакритических символа.
Примером надстрочного диакритического знака является двоеточие, входящее в состав русской буквы "ё". В немецком языке двоеточие называется умляут (нем. Umlaut) и служит для смягчения некоторых гласных звуков: ä, ö и ü. Двоеточие применяется и в украинском языке в составе буквы "ї", обозначающей звук [йи]. Другими надстрочными диакритиками являются: акцент (широко представленный во французском, чешском, польском, словацком, венгерском и ряде других языков), циркумфлекс (эсп. "cirkumflekso"), точка и т.д. В качестве подстрочных дикритических символов используются: запятая, огонэк, седиль и т.д. Внутристрочными диакритическими символами являются: двоеточие, тильда, дефис, титло и т.д.
Следует отметить, что добавление к существующим в алфавите буквам диакритических знаков - далеко не единственный способ расширения систем записи. В некоторые языки с этой целью вводились новые буквы (например, буква "ß" (эсцет) в немецком языке) или создавались буквенные кластеры.
Ниже приводятся буквы из разных иностранных языков, перевод с которых оказывает наше бюро, в которых используются диакритические знаки. В нашем определителе языка эти буквы получили название "маркеров языка" и служат для предварительного определения языка текста.
турецкий | â, Ç, ç, Ğ, ğ, İ, ı, î, Ö, ö, Ş, ş, Ü, ü |
французский | é, à, ç, è, û, î, ô, œ |
испанский | ç, ñ, á, é, í, ú, ü, ¿, ¡ |
португальский | ç, º, ª, ã, õ, á, é, ú, ó, í, à, ò |
немецкий | Ä, ä, Ö, ö, Ü, ü,, ß |
итальянский | á, é, è, ì, í, î, ò, ó, ù, ú |
русский (кириллица) | ё, й |
голландский | á, ä, é, ë, í, ï, ó, ö, ú, ü, Á, Ä, É, Ë, Í, Ï, Ó, Ö, Ú |
шведский | å, ö, ä, Å, Ö, Ä, |
финский | å, ö, ä, Å, Ö, Ä, |
датский | å, æ, ø, Å, Æ, Ø |
польский | ż, ś, ó, ł, ą, ń, ć, ź, Ł, ę |
чешский | ě, š, č, ř, ž, ý, á, í, é, ú, ů, đ, Đ, ł, Ł, ß |
венгерский | í, ö, ü, ó, ő, ú, ű, é, á, Í, Ö, Ü, Ó, Ő, Ú, Ű, É, Á |
словенский | š, ž, č, Š, Ž, Č |
словацкий | ľ, š, č, ť, ž, ý, á, í, é, ú, ä, ň, ô, đ, Đ, ł, Ł, ß, |
эстонский | ü, õ, ö, ä, Ü, Õ, Ö, Ä, Š, Ž |
латвийский | ļ, Ē, Č, Ž, Ķ, Š, Ģ, Ņ, Ī, Ā, Ļ, ū, ē, č, ž, ķ, š, ģ, ņ, ī, ā |
литовский | ą, č, ę, ė, į, š, ų, ū, ž, Ą, Č, Ę, Ė, Į, Š, Ų, Ū, Ž |
мальтийский | ċ, ġ, ħ, ż, À, Ċ, Ġ, È, Ù, Ì, Ò, Ħ, è, ù, ì, ò, à |
румынский | ă, î, â, ş, ţ, Ă, Î, Â, Ş, Ţ, đ, Đ, ł, Ł, ß |
вьетнамский | ă, â, ê, ô, đ, ₫, ư, ơ |