KOMPARASI KECEPATAN ALGORITMA BIG DATA MAPREDUCE DAN SPARK DI ATAS PLATFORM CLUSTER HADOOP UNTUK KLUSTERISASI ULASAN PRODUK DI AMAZON MENGGUNAKAN K-MEANS

Gunawan, Rakha Elang (2023) KOMPARASI KECEPATAN ALGORITMA BIG DATA MAPREDUCE DAN SPARK DI ATAS PLATFORM CLUSTER HADOOP UNTUK KLUSTERISASI ULASAN PRODUK DI AMAZON MENGGUNAKAN K-MEANS. Diploma thesis, State Polytechnic of Malang.

[img] Text
Cover.pdf
Restricted to Registered users only

Download (332kB) | Request a copy
[img] Text
BAB I.pdf
Restricted to Registered users only

Download (84kB) | Request a copy
[img] Text
BAB II.pdf
Restricted to Registered users only

Download (277kB) | Request a copy
[img] Text
BAB III.pdf
Restricted to Registered users only

Download (165kB) | Request a copy
[img] Text
BAB IV.pdf
Restricted to Registered users only

Download (1MB) | Request a copy
[img] Text
BAB V.pdf
Restricted to Registered users only

Download (373kB) | Request a copy
[img] Text
BAB VI.pdf
Restricted to Registered users only

Download (161kB) | Request a copy
[img] Text
BAB VII.pdf
Restricted to Registered users only

Download (5kB) | Request a copy
[img] Text
Daftar Pustaka.pdf
Restricted to Registered users only

Download (136kB) | Request a copy
[img] Text
Lampiran.pdf
Restricted to Registered users only

Download (206kB) | Request a copy

Abstract

Pada era digital saat ini, data yang dihasilkan secara terus-menerus semakin meningkat. Salah satu sumber data yang sangat berharga adalah ulasan produk di e-commerce Amazon. Klasterisasi ulasan produk dapat memberikan wawasan yang berharga bagi perusahaan dana penelitian, namun, pemrosesan dan analisis data yang besar dan kompleks membutuhkan waktu komputasi yang lebih cepat. Oleh karena itu, pada penelitian ini bertujuan untuk membandingkan waktu komputasi implementasi algoritma k-means dengan pendekatan secara tradisional, mapreduce, dan spark. Pendekatan secara tradisional algoritma k-means dijalankan secara sekuensial atau menggunakan satu sistem komputer. Pada pendekatan mapreduce, algoritma k-means menggunakan dua fungsi map dan reduce secara terdistribusi menggunakan kluster komputer secara virtual. Pada pendekatan spark, algoritma k-means menggunakan objek data RDD secara terdistribusi yang sama seperti mapreduce menggunakan kluster komputer secara virtual. Eksperimen perbandingan kecepatan komputasi ketiga metode menggunakan ukuran data dibagi lima variasi data 100 MB, 500 MB, 800 MB, dan 100 MB lalu jumlah partisi bagi spark adalah 2, 10, 20, 40, dan 80 dan yang terakhir jumlah blok data bagi mapreduce adalah 10 MB, 50 MB, 128 MB, 200 MB, 400 MB, 700 MB, 1500 MB, dan 3000 MB. Hasil eksperimen tersebut menunjukkan bahwa komputasi yang menggunakan spark lebih cepat daripada pendekatan tradisional dan mapreduce di seluruh metode perbandingan dan jumlah partisi optimal di ukuran partisi 10 hingga 40, namun konsumsi memori yang digunakan pada spark lebih banyak digunakan dari pendekatan secara mapreduce dan tradisional sehingga tidak dapat dikatakan efisien dan efektif.

Item Type: Thesis (Diploma)
Uncontrolled Keywords: Algoritma Big Data, Apache Hadoop, Apache Spark, K-Means, Produk Amazon
Subjects: A Computer Science > Computer Programming
A Computer Science > Applied Computer Science
Divisions: Jurusan Teknologi Informasi > Teknik Informatika
Depositing User: Rakha Elang Gunawan
Date Deposited: 08 Feb 2024 16:14
Last Modified: 08 Feb 2024 16:14
URI: http://repota.jti.polinema.ac.id/id/eprint/859

Actions (login required)

View Item View Item