sql >> Databáze >  >> RDS >> Mysql

Jaké řazení MySQL je nejlepší pro přijímání všech znaků Unicode?

Posouzení je to nejmenší z vašich starostí, na co musíte myslet, je znaková sada pro sloupec/tabulku/databázi. Porovnání (pravidla, jak se data porovnávají a seřazeno ) je jen důsledkem toho.

MySQL podporuje několik znakových sad Unicode, utf8 a utf8mb4 být nejzajímavější. utf8 podporuje znaky Unicode v BMP , tedy podmnožinu celého Unicode. utf8mb4 , dostupný od MySQL 5.5.3, podporuje vše Unicode.

Posouzení pro použití s ​​jakýmkoli kódováním Unicode je s největší pravděpodobností xxx_general_ci nebo xxx_unicode_ci . První je obecný třídicí a porovnávací algoritmus nezávislý na jazyce, druhý je kompletnější algoritmus nezávislý na jazyce, který podporuje více funkcí Unicode (např. považuje „ß“ a „ss“ za ekvivalent), ale je proto také pomalejší.

Viz https://dev.mysql.com/ doc/refman/5.5/en/charset-unicode-sets.html .




  1. SQL:výběr řádků, kde se hodnota sloupce změnila oproti předchozímu řádku

  2. SQL Server FOR JSON AUTO Příklady (T-SQL)

  3. Náhodně odebraná postgres výchozí oprávnění superuživatele - mohu je získat zpět?

  4. Jak přidám další členy do svého sloupce typu ENUM v MySQL?