sql >> Databáze >  >> RDS >> Oracle

Je něco špatného na použití systému Windows-1252 místo UTF-8

Windows 1252 je jednou z mnoha znakových sad pevné velikosti. Mac má vlastní sadu. existuje několik ISO pro různé části Evropy a pro některé další části světa. Většina z nich má drobné odchylky.

Dobré je, že máte znak pevné velikosti, což znamená 1 znak =1 bajt bez ohledu na to, co.

Špatné body jsou:

  • Někteří lidé nemusí mít vaše kódování nainstalováno
  • Někteří lidé mohou používat mírně odlišné kódování, což má za následek velmi málo problémů, které nejsou zřejmé, ale z dlouhodobého hlediska jsou velmi ošklivé
  • Můžete podporovat pouze několik jazyků

To zahrnuje jakoukoli citaci, kterou byste chtěli provést. V systému Windows-1252 nelze zobrazit ruštinu, řečtinu, polštinu ...

UTF-8 je standardní kódování pro reprezentaci unicode na 1+ bajtech. Může představovat velmi velkou většinu znaků, se kterými se můžete setkat, ačkoli je navržen pro jazyky založené na latince, protože jiné jazyky zabírají více úložného prostoru.

Používá se v XML, JSON a většině typů webových služeb, které můžete najít. Je to dobré výchozí nastavení, když nevíte, jaké kódování použít. Umožňuje omezit počet problémů s kódováním, jako například „I když jsem byl v Latin-1 / Ne, používal jsem latin-9, ale ten chlap na Macu použil Roman“. Pokud na obsahu webu pracuje více než 1 lidé, mohou mít na své platformě různá kódování, a proto může být váš obsah v určitém okamžiku zpackaný.

UTF-8 je, pokud vím, jediný způsob, jak snadno standardizovat kódování používané mezi lidmi bez diskuse.

Typickým příkladem je, že pokud je váš web zakódován ve windows1252 a nový vývojář má mac, pravděpodobně budete mít potíže.



  1. Při dokončení kurzu aktualizujte externí databázi

  2. Kde najdu úplný seznam předdefinovaných výjimek Oracle pl/SQL?

  3. Průvodce indexy MySQL

  4. MySQL Převeďte data latin1 do UTF8