Single Blog Title

This is a single blog caption
4 Oct 2021

Arti dari Data Science

//
Comments0

Apa itu Data Science ?

Data Science adalah lmu pengetahuan interdisiplin tentang metode komputasi untuk mendapatkan wawasan berharga yang dapat ditindaklanjuti dari kumpulan data yang mencakup tiga fase yaitu desain data, mengumpulkan data, dan analisis data. Sebagai ilmu interdisiplin, data science mempunyai definisi yang berbeda-beda dari akademisi maupun praktisi yang berkecimpung di dalamnya.

Bagi kamu yang tertarik mendalami Data Science, belajar Prograaming Python merupakan pilihan yang tepat.

Penggunaan Data Science

Data Science merupakan ilmu terapan baru yang perkembangannya dituntut oleh meningkatnya penggunaan teknologi secara signifikan. Data science digunakan oleh perusahaan maupun instansi tertentu untuk melakukan analisis data yang tidak bisa dilakukan dengan metode sederhana. Misalkan marketplace Tokopedia memerlukan suatu pengetahuan yang dapat melakukan analisis data penjual dan pembeli di platform mereka. Tentunya, data yang mereka punyai setiap detiknya terus berubah atau bertambah. Sehingga diperlukan suatu metode komputasi untuk mengambil data tersebut serta melakukan perhitungan yang dapat menganalisis informasi pada data tersebut. Disinilah peran data science dalam pemenuhan kebutuhan suatu perusahaan atau instansi.

3 Disiplin Ilmu dalam Data Science

Seperti penjelasan sebelumnya, data science adalah ilmu interdisiplin yang berarti data science terbentuk dari berbagai ilmu pengetahuan. Data Science mencakup disiplin ilmu yang luas, berdasarkan diagram di atas terdapat 3 disiplin ilmu yang fokus pada Data Science.

1. Machine Learning

Ai technology brain background digital transformation concept Free Photo

Machine learning merupakan irisan dari ilmu matematika dan statistika dengan ilmu komputer. Machine Learning adalah cabang dari disiplin ilmu kecerdasan buatan (Artificial Intelligence) yang bertujuan memberikan kemampuan kepada komputer untuk dapat melakukan proses belajar. Banyak algoritma machine learning yang digunakan untuk melakukan analisis data dengan tingkat akurasi yang tinggi, yang paling populer adalah neural network. Dimana kita ketahui fundamental sebuah algoritma selalu menggunakan ilmu matematika. Salah satu penerapannya adalah Cortana atau yang lebih dikenal sebagai asisten dari pengguna Windows 10 merupakan salah satu penerapan machine learning.

2. Traditional Software

Traditional software merupakan irisan dari ilmu komputer dengan SME (Subject Matter Expertise), SME adalah pengetahuan mengenai proses dari suatu bisnis atau instansi untuk beroperasi sehingga dapat dibuat suatu sistem yang dapat membantu bisnis atau instansi tersebut. Penerapan traditional software hampir digunakan oleh seluruh instansi pemerintahan maupun bisnis, contohnya e-learning, e-library, online banking, Point of Sales (PoS), dan lain-lain.

3. Traditional Research

Traditional research merupakan irisan dari ilmu matematika dan statistika dengan SME (Subject Matter Expertise). Traditional research hampir digunakan berbagai perusahaan, instansi serta universitas. Penelitian-penelitian yang dilakukan umumnya menggunakan traditional research.

Dari ketiga bidang ilmu tersebut, terbentuklah data science sebagai disiplin ilmu baru yang dapat memenuhi kebutuhan analisis data menggunakan kecerdasan komputer.

Proses Data Science

Menjelaskan proses Data Science bukanlah hal yang mudah. Namun, prosesnya dapat dirangkum dalam 5 poin OSEMN sebagai berikut :

1. Obtain

Langkah pertama untuk memulai sebuah proyek Data Science adalah Obtain, yaitu mendapatkan atau mengumpulkan data.

Data dikumpulkan dari sumber-sumber data. Kemudian digunakan kemampuan teknis seperti MySQL untuk memroses datanya.

Jika menggunakan Python atau R, kamu bisa langsung membaca data dari sumbernya secara langsung ke program Data Science yang digunakan.

Untuk mengambil data dari sumber, dibutuhkan kemahiran bermacam-macam sesuai dengan tipe dan ukuran file yang didapatkan.

2. Scrub

Setelah mengumpulkan data, hal selanjutnya yang harus dilakukan dalam tahap proses Data Science adalah Scrubbing Data.

Scrubbing data adalah proses pembersihan atau filter data. Jika ada data yang tidak penting atau tidak relevan, harus disingkirkan. Pada tahap ini, dilakukan juga standardisasi format data.

Dari format bermacam-macam di tahap pertama, seluruh data dikonversi ke satu format yang sama.

Setelah itu, jika ada data yang kurang atau hilang, harus dilakukan penyesuaian agar dapat diproses.

Proses scrubbing juga meliputi penyatuan dan pemisahan kategori data tergantung kebutuhan.

Pada dasarnya, tahap scrubbing merupakan proses mengatur, merapikan data, serta membuang apapun yang tidak diperlukan, dan mengganti data yang hilang serta menstandardisasi seluruh formatnya.

3. Explore

Pada tahap ini, penggalian dan pemeriksaan data dilakukan.

Pertama-tama, semua data harus diperiksa propertinya, karena tipe data yang berbeda memerlukan perlakuan yang berbeda pula.

Kemudian, statistik deskriptif harus dihitung untuk dapat mengekstrak fitur dan menguji variabel yang signifikan.

Terakhir, visualisasi data digunakan untuk mengidentifikasi pola dan tren signifikan dalam data yang sudah kamu dapatkan.

Dengan begitu, bisa diperoleh gambaran yang lebih jelas dengan grafik agar pentingnya data dapat lebih dipahami.

4. Model

Setelah memastikan tahap scrub dan explore sudah dilakukan maksimal, maka kamu dapat lanjut ke tahap data science selanjutnya, yaitu model.

Pada tahap ini, dibuat model data untuk mencapai tujuan yang diinginkan.

Pada tahap ini, digunakan regresi dan prediksi untuk memperkirakan nilai di waktu mendatang serta melakukan klasifikasi dan pengelompokan grup nilai dari data.

5. Interpret

Tahap terakhir dalam proses Data Science adalah Interpretasi Data.

Interpretasi data adalah proses penting di mana dilakukan interpretasi model dan data.

Output dari pengolahan data yang diinterpretasi harus bisa dipahami oleh orang-orang awam yang tidak mengerti istilah teknis.

Presentasinya bertujuan untuk menjawab persoalan bisnis berdasarkan data yang diperoleh.

Pada tahap interpretasi data, kemampuan komunikasi yang baik juga sangat dibutuhkan untuk menyampaikan poin-poin pentingnya secara efektif pada semua orang yang berkepentingan.

Leave a Reply

×

Konsultasikan dengan kami

Kami akan menjelaskan lebih lanjut mengenai pelatihan kami

× Ada pertanyaan?