Contoh Kasus Cosine Similarity

Perkembangan teknologi memiliki dampak yang sangat besar terhadap kehidupan kita sehari-hari, mulai dari kegiatan yang sederhana hingga kegiatan yang memiliki tingkat kerumitan yang sangat tinggi. Dalam sebuah instansi, kegiatan yang umum dilakukan adalah pengarsipan dokumen. Dokumen-dokumen yang ada akan dikelompokkan berdasarkan ciri-ciri atau kategori tertentu. Dengan banyaknya dokumen yang harus diarsipkan, tentunya hal ini akan memakan banyak waktu untuk menyelesaikannya. Di sinilah kita membutuhkan metode untuk membantu pekerjaan tersebut hingga menjadi praktis dan efisien. Cosine similarity dapat menjadi jawaban untuk menyelesaikan permasalahan ini. Dengan cosine similarity, dokumen-dokumen yang memiliki kesamaan karakteristik dapat dikelompokkan menjadi satu kategori. Cosine similarity merupakan ukuran kesamaan antara dua vektor bukan nol dari ruang produk dalam yang mengukur kosinus sudut di antaranya. Metode ini dapat digunakan untuk menghitung tingkat kemiripan antar kalimat.

Selain digunakan dalam mengarsipkan dokumen seperti contoh tadi, cosine similarity juga dapat digunakan untuk mendeteksi plagiarisme. Satu lagi dampak perkembangan teknologi dalam kehidupan sehari-hari kita adalah kemudahan dalam sharing, mendapatkan informasi, ataupun data melalui internet. Dengan adanya kemudahan ini, tentunya akan sangat membantu kita dalam mendapatkan inspirasi ataupun referensi untuk membuat karya ilmiah, laporan, skripsi, dan lain-lain. Namun, dibalik kemudahan itu, terdapat pula dampak negatifnya. Sebagian orang memanfaatkan kemudahan ini untuk mengambil karya orang lain yang ada di internet, dan mengakuinya sebagai karya sendiri. Hal ini dikenal dengan plagiarisme. Untuk mendeteksi plagiarisme secara manual, tentunya dibutuhkan ketelitian yang tinggi dan waktu yang cukup lama. Oleh karena itu, cosine similarity dapat digunakan untuk membantu pekerjaan ini, mendeteksi tingkat kemiripan suatu dokumen dengan dokumen lainnya.

Cosine similarity juga dapat diterapkan pada aplikasi pencarian. Misalnya, ada aplikasi yang berkaitan dengan kitab undang-undang hukum dagang. Masalah yang dapat diatasi dengan metode cosine similarity adalah mempermudah seseorang untuk menemukan bagian ayat atau pasal tertentu. KUHD yang terdiri dari 2 kitab dan 23 bab tentu akan menyulitkan kita mencari ayat atau pasal tertentu secara manual. Dengan metode cosine similarity, query yang dimasukkan oleh user akan dicari berdasarkan kesamaannya pada KUHD.

Cosine similarity dapat menghitung jumlah kata yang sama pada suatu kalimat, dan membandingkannya dengan kalimat lain. Metode ini dapat mengukur tingkat kemiripan suatu dokumen. Untuk mencari tingkat kemiripan suatu teks, dapat dilakukan dengan cara menghitung jumlah kemunculan kata ke n pada kalimat 1 dikali dengan kemunculan kata ke n pada kalimat 2, kemudian dibagi dengan akar dari jumlah kata ke n pada kalimat 1 dikuadratkan dikali akar dari jumlah kata ke n pada kalimat 2.

Misalkan diberi contoh, terdapat kalimat A dan B:

A: Juli lebih suka aku dari pada Linda yang suka aku

B: Jane lebih suka aku dari pada Juli yang suka aku

Dari kedua kalimat itu, maka didapat data sebagai berikut:

  1. Juli: pada kalimat A ada 1, kalimat B ada 1
  2. Lebih: pada kalimat A ada 1, kalimat B ada 1
  3. Suka: pada kalimat A ada 2, kalimat B ada 2
  4. Aku: pada kalimat A ada 2, kalimat B ada 2
  5. Dari: pada kalimat A ada 1, kalimat B ada 1
  6. Pada: pada kalimat A ada 1, kalimat B ada 1
  7. Linda: pada kalimat A ada 1, kalimat B ada 0
  8. Yang: pada kalimat A ada 1, kalimat B ada 1
  9. Jane: pada kalimat A ada 0, kalimat B ada 1

Kemudian, untuk mencari tingkat kemiripannya yaitu:

Dengan begitu, dapat disimpulkan bahwa tingkat kemiripan kalimat A dengan kalimat B adalah 0.92857142857.

 

Penulis : Syafira

Sukai/Like Fan Page Facebook Garuda Cyber Indonesia

Subscribe Channel Youtube Garuda Cyber Indonesia

Follow Instagram Garuda Cyber Indonesia

Chat Wa

Artikel Terpopuler

Definisi Struktur Kontrol Perulangan Dalam Pemrograman Dan Contohnya

Pada dasarnya perulangan pada pemrograman yang sama dengan perulangan bahasa pemrograman lainnya. Struktur kontrol perulangan yang dipakai memilki suatu fungsi dari program yang akan dijalankan secara berulang. Contohnya anda ingin membuat tampilan nama anda sebanyak 100 kali, tentu akan sangat lama jika anda menuliskan kode program secara dengan manual. Dengan struktur kontrol perulangan bisa menampilkan dengan nama sebanyak 100 kali...