Teknik Kompilasi Andi Saputra: 2018

1. Apa yang di maksud dengan analisis semantic ?

Semantik (dari Bahasa Yunani: semantikos, memberikan tanda, penting, dari kata sema, tanda) adalah cabang linguistik yang mempelajari arti/makna yang terkandung pada suatu bahasa, kode, atau jenis representasi lain. Dengan kata lain, Semantik adalah pembelajaran tentang makna. Semantik biasanya dikaitkan dengan dua aspek lain: sintaksis, pembentukan simbol kompleks dari simbol yang lebih sederhana, serta pragmatika, penggunaan praktis simbol oleh komunitas pada konteks tertentu.Semantik Linguistik adalah studi tentang makna yang digunakan untuk memahami ekspresi manusia melalui bahasa. Bentuk lain dari semantik mencakup semantik bahasa pemrograman, logika formal, dan semiotika.Kata semantik itu sendiri menunjukkan berbagai ide - dari populer yang sangat teknis. Hal ini sering digunakan dalam bahasa sehari-hari untuk menandakan suatu masalah pemahaman yang datang ke pemilihan kata atau konotasi. Masalah pemahaman ini telah menjadi subyek dari banyak pertanyaan formal, selama jangka waktu yang panjang, terutama dalam bidang semantik formal. Dalam linguistik, itu adalah studi tentang interpretasi tanda-tanda atau simbol yang digunakan dalam agen atau masyarakat dalam keadaan tertentu dan konteks Dalam pandangan ini, suara, ekspresi wajah, bahasa tubuh, dan proxemics memiliki semantik konten (bermakna), dan masing-masing terdiri dari beberapa cabang studi. Dalam bahasa tertulis, hal-hal seperti struktur ayat dan tanda baca menanggung konten semantik, bentuk lain dari bahasa menanggung konten semantik lainnya.Studi formal semantik bersinggungan dengan banyak bidang penyelidikan lain, termasuk leksikologi, sintaksis, pragmatik, etimologi dan lain-lain, meskipun semantik adalah bidang yang didefinisikan dengan baik dalam dirinya sendiri, sering dengan sifat sintetis.Dalam filsafat bahasa, semantik dan referensi berhubungan erat. Bidang-bidang terkait termasuk filologi, komunikasi, dan semiotika. Studi formal semantik karena itu menjadi kompleks.Semantik berbeda dengan sintaks, studi tentang kombinatorik unit bahasa (tanpa mengacu pada maknanya), dan pragmatik, studi tentang hubungan antara simbol-simbol bahasa, makna, dan pengguna bahasa.Dalam kosakata ilmiah internasional,semantik juga disebut semasiologi.

2. Parsing data ? (bottom up – bottom down)

Bottom-up Versus Top-down

Nama bottom-up berasal dari konsep pohon parse, di mana bagian yang paling rinci berada di bagian bawah (terbalik) pohon, dan struktur yang lebih besar terdiri dari mereka berada di lapisan lebih tinggi berturut-turut, sampai di bagian atas atau "root" dari pohon, satu unit menggambarkan seluruh aliran input. Sebuah parse bawah-atas menemukan dan memproses pohon itu mulai dari ujung kiri bawah, dan secara bertahap bekerja dengan cara ke atas dan ke kanan. [1] Pengurai dapat bertindak pada tingkat hierarki struktur rendah, menengah, dan tertinggi tanpa pernah membuat pohon data yang sebenarnya; pohon tersebut kemudian hanya tersirat dalam tindakan parser. Penguraian bottom-up dengan malas menunggu sampai ia telah memindai dan menguraikan semua bagian dari beberapa konstruk sebelum melakukan apa yang dikonstruksinya.

Top-down parse steps

Kebalikan dari ini adalah penguraian top-down, di mana struktur keseluruhan masukan diputuskan (atau ditebak) terlebih dahulu, sebelum berurusan dengan bagian tingkat menengah, meninggalkan penyelesaian semua detail tingkat terendah untuk bertahan. Pengurai top-down menemukan dan memproses pohon hierarkis mulai dari atas, dan secara bertahap bekerja dengan cara pertama ke bawah dan kemudian ke kanan. Penguraian top-down dengan penuh semangat memutuskan apa yang membangun jauh sebelumnya, ketika hanya memindai simbol paling kiri dari konstruk itu dan belum memilah bagian-bagiannya. Parsing sudut kiri adalah metode hibrida yang bekerja dari bawah ke atas di sepanjang tepi kiri setiap subpohon, dan dari atas ke bawah pada sisa pohon parse.

Jika tata bahasa memiliki beberapa aturan yang mungkin dimulai dengan simbol paling kiri yang sama tetapi memiliki akhiran yang berbeda, maka tata bahasa itu dapat ditangani secara efisien oleh parse bawah-permukaan yang deterministik tetapi tidak dapat ditangani dari atas ke bawah tanpa dugaan dan mundur. Jadi, parser bottom-up menangani rentang grammar bahasa komputer yang agak lebih besar daripada parser top-down yang deterministik.

Penguraian bottom-up terkadang dilakukan dengan backtracking. Tetapi jauh lebih umum, penguraian bottom-up dilakukan oleh pengurai pengurang pergeseran seperti parser LALR.

Contoh

Beberapa parser yang menggunakan parsing bawah-atas meliputi:

Presedensi parser

Pengurai preseden sederhana

Pengurai prioritas operator

Pengurai batas konteks (BC)

LR parser (Left-to-right, derivasi paling kanan secara terbalik)

Simple LR parser (SLR)

Pengurai LALR (Lihat-Depan)

Canonical LR parser (LR (1))

GLR parser (Umum)

CYK parser (Cocke – Younger – Kasami)

Pendakian pendakian rekursif

Packrat parser

Pengganti-kurangi parser

3. Grammer s → A ǀ 1 2 3 . . . . . H ǀ a ǀ b ǀ c . . . . . .

Tata bahasa berikut, dengan simbol awal S, non-free grammar {anbncn: n ≥ 1}:

1. S → B C

2. S → S B C

3. C B → C Z

4. C Z → W Z

5. W Z → W C

6. W C → B C

7. a B → a b

8. b B → b b

9. b C → b c

10. c C → c c

Aturan 1 dan 2 memungkinkan untuk meledakkan S ke anBC (BC) n-1; aturan 3 hingga 6 memungkinkan untuk saling bertukar setiap CB ke BC (empat aturan diperlukan untuk itu karena aturan CB → BC tidak akan masuk ke dalam skema αAβ → αγβ); aturan 7–10 mengijinkan mengganti B dan C non-terminal dengan terminalnya masing-masing b dan c, asalkan berada di tempat yang tepat. Sebuah rantai generasi untuk aaabbbccc adalah:

→ 2 aSBC

→ 2 aaSBCBC

→ 1 aaaBCBCBC

→ 3 aaaBCZCBC

→ 4 aaaBWZCBC

→ 5 aaaBWCCBC

→ 6 aaaBBCCBC

→ 3 aaaBBCCZC

→ 4 aaaBBCWZC

→ 5 aaaBBCWCC

→ 6 aaaBBCBCC

→ 3 aaaBBCZCC

→ 4 aaaBBWZCC

→ 5 aaaBBWCCC

→ 6 aaaBBBCCC

→ 7 aaabBBCCC

→ 8 aaabbBCCC

→ 8 aaabbbCCC

→ 9 aaabbbcCC

→ 10 aaabbbccC

→ 10 aaabbbccc

Tata bahasa yang lebih rumit dapat digunakan untuk mengurai {anbncndn: n ≥ 1}, dan bahasa lain dengan lebih banyak huruf.

Sebuah tatabahasa yang sensitif konteks untuk bahasa {a2i: i ≥ 1} dibangun dalam Contoh 9.5 (hal. 224) dari (Hopcroft, Ullman, 1979).

Pengertian chomsky

Chomsky adalah salah satu pemrakarsa teori pemerolehan bahasa yang meyakini bahwa proses pemerolehan bahasa adalah suatu proses mental atau sebuah hirarki penahanan kelas tata bahasa formal. Yang digambarkan oleh Noam Chomsky pada tahun 1956. Hal ini juga dinami Marcel-Paul Schutzenberger, yang memainkan peran penting dalam pengembangan teori bahasa formal. Pada dasranya Chomsky Hierarchy ini memungkinkan kemungkinan bagi pemahaman dan penggunaan model ilmu komputer yang memungkinkan programmer untuk mencapai tujuan linguistik bermakna sistematis.

Noam Chosky menciptakan model matematika sebagai sarana untuk mendeskripsikan bahasa. Perbedaan antara bahasa komputer dan bahasa manusia adalah sampai saat ini belum diketahui bagaimana cara manusia mengartikan bahasa, sementara dengan pasti dapat mengartikan bahasa pada komputer. Noam Chomsky mengemukakan perangkat format yang disebut dengan grammar untuk memodelkan properti-properti bahasa. Grammar mempunyai nilai/manfaat sangat besar di ilmu informatika/komputer karena pencapaian ini digunakan untuk mendefinisikan dan mendeskripsikan sintaks bahasa pemrograman dan bahasa-bahsa formal lainnya. Grammar diterapkan pada perancangan kompilator dan bidang-bidang di ilmu komputer.

Bentuk Normal Chomsky / Chomsky Normal Form (CNF) merupakan salah satubentuk normal yang sangat berguna untuk Context Free Grammar (CFG). Bentuk Normal Chomsky dapat dibuat dari sebuah tata bahasa bebas konteks yang telah mengalami penyederhanaan yaitu penghilangan produksi useless, unit, dan . Dengan kata lain, suatu tata bahasa bebas konteks dapat diubah menjadibentuk normal Chomsky dengan syarat tata bahasa bebas konteks berikut:

· Tidak memiliki produksi useless

· Tidak memiliki produksi unit

· Tidak memiliki produksi

Tipe-tipe Chomsky Hierarchy

Noam Chomsky menyusun grammardalam urutan yang dia sebut tipe 0, 1, 2 san 3. Tipe 0 adalah bentuk yang paling bebas dan paling sulit dikenali, biasa disebutrecursively enumerable set, untuk mengenali bentuk ini biasa dipakai Turing Machine.Berikutnya adalah tipe 1 yang disebutcontext free grammar secara murni (tanpa tambahan metoda tertentu) adalah tidak cukup untuk pengolahan bahasa alami.Context Free Grammar sifat lebih mudah dipahami perilakunya dan pengolahannya serta masih dapat diolah dalam bentuk program yang terstruktur.

Chomsky Hierarchy terdiri atas empat tipe yaitu:

1. Tipe-0

Tipe-0 tata bahasa (grammar terbatas) mencangkup semua tata bahasa formal. Mereka menghasilkan persis semua bahasa yang bisa dikenali oleh mesin Turing. Bahasa ini juga biasanya disebut dengan bahasa rekursif enumerable.

2. Tipe-1

Tipe-1 tata bahasa (grammar context-sensitive) menghasilkan bahasa konteks – sensitif. Tata bahasa ini memiliki aturan. Bahasa yang dijelaskan oleh tata bahasa ini sama persis dengan semua bahasa yang bisa dikenali oleh robot yang dibatasi oleh linear (mesin Turing nondeterministic yang dibatasi oleh waktu konstan panjang input).

3. Tipe-2

Tipe-2 tata bahasa (bebas konteks) menghasilkan bahasa bebas konteks. Bahasa ini persis sama dengan semua bahasa yang dikenali oleh nondeterministic otomat pushdown. Bahasa bebas konteks merupakan dasar teoritis untuk sintaks bahasa pemrograman.

4. Tipe-3

Tipe-3 tata bahasa (grammar biasa) menghasilkan bahasa biasa. Tata bahasa seperti ini membatasi aturan untuk nonterminal tunggal di sisi kiri dan sisi kanan yang terdiri dari satu terminal, mungkin diikuti (atau didahului, tetapi tidak dalam bahasa yang sama) oleh nonterminal tunggal. Bahasa ini persis sama dengan semua bahsa yang dapat diputuskan oleh negara yang terbatas. Selain itu, bahasa resmi dapat diperoleh dengan ekspresi reguler. Bahasa reguler biasanya digunakan untuk menentukan pola pencarian dan struktur leksikal bahasa pemrograman.

Contohnya :

Contoh, Context Free Grammar ( kita anggap CFG pada bab ini sudah mengalami Penyederhanaan CFG ):

S → bA | aB

A → bAA | aS | a

B → aBB | bS | b

Aturan produksi yang sudah dalam bentuk normal Chomsky:

A → a

B → b

Dilakukan penggantian aturan produksi yang belum bentuk normal Chomsky (‘=>’ bisa dibaca berubah menjadi):

S → bA => S → P1A

S → aB => S → P2B

A → bAA =>A → P1AA => A → P1P3

A → aS => A → P2S

B → aBB => B → P2BB => B → P2P4

B → bS => B → P1S

Terbentuk aturan produksi dan simbol variabel baru:

P1 → b

P2 → a

P3 → AA

P4 → BB

Hasil akhir aturan produksi dalam bentuk normal Chomsky :

A → a

B → b

S → P1A

S → P2B

A → P1P3

A → P2S

B → P2P4

B → P1S

P1 → b

P2 → a

P3 → AA

P4 → BB

P1 = P, P2 =Q, P3 =R, P4 =T, sehingga aturan produksinya menjadi:

S → PA

S → QB

A → PR

A → QS

A → a

B → QT

B → PS

B → b

P → b

Q → a

R → AA

T → BB

Teknik Kompilasi Andi Saputra

Minggu, 04 November 2018

Analisa Semantik

Jumat, 19 Oktober 2018

Klasifikasi Chomsky dan Contoh