Jaké řazení MySQL je nejlepší pro přijímání všech znaků Unicode?

Posouzení je to nejmenší z vašich starostí, na co musíte myslet, je znaková sada pro sloupec/tabulku/databázi. Porovnání (pravidla, jak se data porovnávají a seřazeno ) je jen důsledkem toho.

MySQL podporuje několik znakových sad Unicode, utf8 a utf8mb4 být nejzajímavější. utf8 podporuje znaky Unicode v BMP , tedy podmnožinu celého Unicode. utf8mb4 , dostupný od MySQL 5.5.3, podporuje vše Unicode.

Posouzení pro použití s jakýmkoli kódováním Unicode je s největší pravděpodobností xxx_general_ci nebo xxx_unicode_ci . První je obecný třídicí a porovnávací algoritmus nezávislý na jazyce, druhý je kompletnější algoritmus nezávislý na jazyce, který podporuje více funkcí Unicode (např. považuje „ß“ a „ss“ za ekvivalent), ale je proto také pomalejší.

Viz https://dev.mysql.com/ doc/refman/5.5/en/charset-unicode-sets.html .