Hlavní navigace

Názor ke článku Jak jsem si oblíbil Python od Miloslav Ponkrác - 39: Prosím Vás, kde jsem napsal, že na...

  • 12. 5. 2006 15:47

    Miloslav Ponkrác (neregistrovaný)

    39: Prosím Vás, kde jsem napsal, že na nižších úrovních by Unicode neměl podporovat?

    Jeden znak = konstatní počet bajtů mi přijde pro vnitřní reprezentaci Unicode jako nejlepší varinata. A jaké znaky se ztratí, když budu Unicode vnitřně ukládat co znak to 4 bajtová hodnota?

    utf-8 bylo vymyšleno pro dva účely:

    1) jako formát pro přenositelné ukládání dat do externích souborů

    2) jako nouzové řešení pro případy, kdy jazyk, nebo knihovna neumí pracovat s řetězci jinak, než jako s bajty. zdůrazňuji NOUZOVÉ ŘEŠENÍ.

    jinak utf-8 není ani pro šetření pamětí, protože se klidně může stát, že řetězec v utf-8 zabírá víc paměti (tedy bajtů), než řetězec uložený tak, že každý znak konstantně zabírá 4 bajty. protože v utf-8 každý znak zabírá podle situace jeden až šest bajtů

Upozorníme vás na články, které by vám neměly uniknout (maximálně 2x týdně).