čtvrtek 20. ledna 2011

Odstranění Byte Order Mark

Byte Order Mark (BOM) je znak kódování Unicode, který označuje endianitu (pořadí bajtů ve vícebajtových znacích) použitou v souboru. Pro data v kódování UTF-8 nemá vůbec žádný význam a pokud se jednou na začátku souboru objeví, je potíž se ho zbavit.

Mě se zjevil v jednom souboru se styly, který byl s dalšími CSS soubory sloučen do jednoho, a protože YUI Compressor BOM ze souboru neodstranil a soubory sloučil i s ním, první CSS pravidlo z ono souboru pak nefungovalo.

BOM umí ze souboru odstranit utilita uconv z knihovny ICU (v Debianu v balíku libicu-dev což je btw pěkný bumbrlíček, i se závislostmi 53MB).
uconv --remove-signature file-with-bom.txt > file.txt

Žádné komentáře:

Okomentovat