Posouzení je to nejmenší z vašich starostí, na co musíte myslet, je znaková sada pro sloupec/tabulku/databázi. Porovnání (pravidla, jak se data porovnávají a seřazeno ) je jen důsledkem toho.
MySQL podporuje několik znakových sad Unicode, utf8
a utf8mb4
být nejzajímavější. utf8
podporuje znaky Unicode v BMP
, tedy podmnožinu celého Unicode. utf8mb4
, dostupný od MySQL 5.5.3, podporuje vše Unicode.
Posouzení pro použití s jakýmkoli kódováním Unicode je s největší pravděpodobností xxx_general_ci
nebo xxx_unicode_ci
. První je obecný třídicí a porovnávací algoritmus nezávislý na jazyce, druhý je kompletnější algoritmus nezávislý na jazyce, který podporuje více funkcí Unicode (např. považuje „ß“ a „ss“ za ekvivalent), ale je proto také pomalejší.
Viz https://dev.mysql.com/ doc/refman/5.5/en/charset-unicode-sets.html .