39: Prosím Vás, kde jsem napsal, že na nižších úrovních by Unicode neměl podporovat?
Jeden znak = konstatní počet bajtů mi přijde pro vnitřní reprezentaci Unicode jako nejlepší varinata. A jaké znaky se ztratí, když budu Unicode vnitřně ukládat co znak to 4 bajtová hodnota?
utf-8 bylo vymyšleno pro dva účely:
1) jako formát pro přenositelné ukládání dat do externích souborů
2) jako nouzové řešení pro případy, kdy jazyk, nebo knihovna neumí pracovat s řetězci jinak, než jako s bajty. zdůrazňuji NOUZOVÉ ŘEŠENÍ.
jinak utf-8 není ani pro šetření pamětí, protože se klidně může stát, že řetězec v utf-8 zabírá víc paměti (tedy bajtů), než řetězec uložený tak, že každý znak konstantně zabírá 4 bajty. protože v utf-8 každý znak zabírá podle situace jeden až šest bajtů
Přečteno 177 047×
Přečteno 141 292×
Přečteno 81 851×
Přečteno 76 914×
Přečteno 66 279×