Utf-8

Kısaca: UTF-8 8-bitlik bir Unicode dönüşüm biçimidir (İng: Unicode Transformation Format 'ın kısaltması). Unicode karakterlerini değişken uzunluklu bayt guruplarıyla kodlamakta kullanılır. ...devamı ☟

UTF-8 8-bitlik bir Unicode dönüşüm formatıdır (İng: ``Unicode Transformation Format`` `ın kısaltması). Unicode karakterlerini değişken uzunluklu bayt guruplarıyla kodlamakta kullanılır. Rob Pike ve Ken Thompson tarafından geliştirilmiştir.

UTF-8 kodlaması Unicode karakterlerini 1-6 byte uzunluğunda diziler olarak kodlar. ASCII kodlaması içinde 0-127 arasında kalan karakterler aynen kendi kodları ile kullanılır, diğerleri ise byte dizileri haline gelir.

Özellikleri

Evrensel kodlama ile aynı sayfada farklı lisanları göstermek mümkün oluyor. Ayrıca özel hazırlanmış klavyeler ile matematiksel ifadeleri de yazmak mümkün. Bütün bu farklı karakterler UTF-8 sayesinde aynı sayfada görünebiliyor. Eski stil kodlama ile türkçe karakterlerin - aslında latin alfabesinde olmayan ya da özel işaretli harflerin de - gösterimi için oldukça karışık olan harf ve rakam dizgileri kullanmak gerekiyordu. Mesela Ş harfini yazmak için Ş küçük ş içinse ş yazmak gibi.

UTF kullanarak 1 milyondan fazla karakter kodlanabilmektedir. Sıklıkla kullanılan 65536 karakterin kodlaması bu 1 milyondan fazla kodlamada ilk sıralarda yer almaktadırlar.

Örnekler

A = 00000000 010000012, yani sağ baştan sıfırdan başlayarak sayıldığıda 2`nin katları şeklinde 20 ve 26`yı toplayarak 65 sayısını elde ediyoruz. Windows için ALT-tuşuna basılı tutarak nümerik klavyeden 65 yazdığı zaman A harfı çıkar.

天 = 0x59 0x298 = 01011001 001010012 = ALT-tuşu + 22825
a‡” = 0x21 0xd38 = 00100001 110100112 = ALT-tuşu + 1587
α = 0x03 0xb18 = 00000011 101100012 = ALT-tuşu + 945


İlgili Bağlantılar

  • http://www.cs.bell-labs.com/sys/doc/utf.pdf UTF-8`i anlatan ilk makale
  • http://www.utf-8.com/ UTF-8


Kaynaklar

Vikipedi

Bu konuda henüz görüş yok.
Görüş/mesaj gerekli.
Markdown kullanılabilir.

Unicode
3 yıl önce

çeşitli karakter kodlamaları geliştirilmiştir. Bunlardan en bilinenleri UTF-8, UTF-16 ve artık kullanımdan kalkmış olan UCS-2'dir. Harflerin bilgisayar ortamında...

Unicode, ASCII, UTF-8, Unicode Consortium, UTF-7, ISO-8859-9, UTF-16, UTF-32, UCS-2, UCS, ISO 10646
Konversation
6 yıl önce

dolayısıyla KDE'den bağımsız sürüm çıkarabiliyor. Çoklu sunucu, IPv6, SSL ve UTF-8 gibi özellikler barındırıyor. SSL sunucu desteği Sunucu ve kanallar için...

Konversation, 2006, Blowfish, Ekim 6, GPL, Google, IPv6, Internet Relay Chat, KDE, Konsole, Pardus
Gerişkatırcı, Bartın
3 yıl önce

görülebilmektedir. http://maps.google.de/maps?q=bartin&oe=utf-8&rls=org.mozilla:de:official&client=firefox-a&um=1&ie=UTF-8&sa=N&hl=de&tab=wl https://web.archive...

Gerişkatırcı, Bartın, 1984, 1989, 1994, 1997, 1999, 2000, 2004, 2007, Amasra, Bartın, Asfalt
IRCX
6 yıl önce

- hosts ve konuşabilenler - voices), belirli IRC operatör seviyeleri ve UTF-8'i tam destekli (rumuzlarda, kanal adlarında vb.) kullanabilmek için yollar...

Kate (metin editörü)
6 yıl önce

görüntüleyebilme Birçok programlama dilinde renklendirebilme ve parantezleri eşleme UTF-8, UTF-16, ASCII vb. kodlama ve kodlama değiştirme desteği CR, CRLF, LF yeni...

Kate (metin editörü), KDE, Taslak şablonları, Taslak madde
Philippe Petit
3 yıl önce

kaya tırmanışı ve boğa güreşi konularında ustalaşmıştır. http://images.google.com.tr/images?hl=tr&resnum=0&q=Philippe%20Petit&um=1&ie=UTF-8&sa=N&tab=wi...

Apache Wicket
6 yıl önce

web.xml The servlet uygulama tanımlaması <?xml version="1.0" encoding="UTF-8"?> <web-app xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns="http://java...

Saçma sıralama
6 yıl önce

numbers[i]; numbers[i] = numbers[rand]; numbers[rand] = temp; } } } #-*- coding: utf-8 -*- import random def BogoSort(numbers): rnd = random.random() while True:...