Razlika između ANSI i Unicode

ANSI vs Unicode

ANSI i Unicode su dva karaktera koja su u jednom ili drugom trenutku bila u širokoj uporabi. Upotreba je također glavna razlika između to dvoje jer je ANSI vrlo star i koriste ga operativni sustavi poput Windows 95/98 i starijih, dok je Unicode novije kodiranje koje danas koriste svi trenutni operativni sustavi. ANSI je imao mnoga ograničenja koja nisu bila očita u ranim fazama njegove uporabe, ali postala su bolno jasna nakon što su se računala počela širiti globalno..

Glavni nedostatak ANSI-a je uporaba mnogih kodnih stranica, ovisno o jeziku koji se koristi; postoji jedan za engleski (poznat kao zapadnoeuropski latinski), grčki, turski, hebrejski, arapski i mnogi drugi. Nema problema kada sva računala koja pristupaju podacima koriste istu kodnu stranicu, ali kada se koriste različite kodne stranice, pročitani podaci ne bi bili isti kao i zapisani podaci. To bi moglo rezultirati korupcijom podataka, pa čak i pad sustava u određenim scenarijima.

Razlog zašto se ANSI ne može prilagoditi je to što koristi samo 8 bita za predstavljanje svake točke kodova. Ta je širina fiksna i ima samo 256 različitih kombinacija. Za usporedbu, Unicode koristi maksimalno 32 bita za svaku kodnu točku; koristi se u fiksnoj širini u UTF-32. Ali budući da je korištenje četiri bajta za svaki znak tako ogroman gubitak prostora, u UTF-8 i UTF-16 se koristi kodiranje promjenjive širine da se uštedi prostor.

Budući da je Unicode noviji standard, očekuje se da ga stariji operativni sustavi možda ne podržavaju. Iako su kodne točke UTF-8 i ANSI prilično identične, stariji operativni sustavi poput Windows 95 ne mogu s njim raditi. Stoga se programi koji koriste Unicode ne bi mogli ispravno izvoditi na ovim operativnim sustavima. S obzirom na suprotno, ili pokretanje ANSI kodiranih programa na novijim operativnim sustavima, moguće je postojati mehanizme za pretvorbu između ANSI-a i Unicode-a. Samo imajte na umu da konverzija dodaje malo režijskih troškova. Možda nije važno s obzirom na današnja računala, ali svejedno vrijedi uzeti u obzir kako bi se poboljšala učinkovitost programa.

Sažetak:

1. ANSI je kodiranje vrlo starih znakova, a Unicode je trenutni standard koji se danas koristi
2. ANSI koristi različite stranice za različite jezike dok Unicode ne
3. ANSI koristi kodiranje fiksne širine dok Unicode može koristiti i fiksnu i promjenjivu širinu
4. Unicode programi neće raditi na starijim sustavima
5. ANSI programi su sporiji od programa Unicode na trenutnim računalima