MENJADI DATA SCIENTIST HARUS BELAJAR DI MAGISTER INFORMATIKA UIN MAULANA MALIK IBRAHIM MALANG

Belajar data science harus mengenal pemrograman Python dan RStudio, bahasa pemrograman ini dirancang khusus untuk mengerjakan segala hal terkait komputasi data, bahasa ini terus berkembang secara pesat seiring dengan semakin populernya terminologi “Big Data” dan meningkatnya kebutuhan perusahaan akan keahlian data science untuk mengolah dan menganalisis data di perusahaan atau instansi sebagai dasar pengambilan kebijakan dan mengautomatisasi proses bisnis menjadi data-driven.
Bidang keahlian Data Science selalu dibicarakan menjadi pekerjaan yang akan mempunyai peminat sangat tinggi dimasa depan. Dengan jumlah data yang ada di dunia mengalami peningkatan cukup pesat, maka bidang keahlian ini semakin dibutuhkan.
Bahasa pemrograman Python dan R yang terdapat pada platform Anaconda telah menjadi pilihan utama bagi para peneliti maupun praktisi di bidang data science untuk mengolah dan menganalisis data baik itu untuk kepentingan penelitian maupun bisnis. Oleh karena itu, bagi mahasiswa Magister Informatika UIN Maulana Malik Ibrahim Malang dengan keahlian pada bidang data science, Python dan R merupakan bahasa pemrograman yang sangat recommended untuk dikuasai. Banyak library Data Science yang sudah masuk kedalam Python dan banyak Machine Learning framework yang lebih mendukung Python.

Bahasa Pemrograman Terpopuler Tahun 2017 (Sumber : https://spectrum.ieee.org/)
Grafik perkembangan Python terhadap bahasa pemrograman yang lain. Source : https://stackoverflow.blog/2017/09/06/incredible-growth-python/

Berdasarkan publikasi yang dirilis oleh IEEE Spectrum ranks languages pada tahun 2017, R termasuk kedalam 10 bahasa pemrograman terpopuler. R berada pada posisi ke-6 diatas bahasa pemrograman Javascript dan PHP yang berturut-turut berada pada posisi ke-7 dan ke-8. Sedangkan peringkat pertama dipegang oleh bahasa pemrograman Python, yang juga sangat diminati oleh data scientist. Salah satu pertimbangan mengapa R bisa masuk kedalam deretan bahasa pemrograman terpopuler adalah semakin banyak yang menggunakan R pada paper-paper penelitian berkelas internasional. Jadi, R terbukti sangat populer digunakan oleh para peneliti-peneliti internasional di bidang data science. Selain itu, R juga dikembangkan secara open source sehingga dapat dipergunakan secara legal tanpa perlu membayar lisensi.

Kenapa harus pemrograman Python dan RStudio :

  • Fokus utama bahasa R adalah Data : Bahasa pemrograman R didesain untuk kebutuhan pengolahan data. Sedangkan bahasa pemrograman Python didesain sebagai bahasa pemrograman yang mudah dipahami dan mudah digunakan. Oleh karena itu, Penggunaan bahasa Python dan R untuk kebutuhan pengolahan Data lebih baik dibandingkan dengan bahasa pemrograman lain.
  • Visualisasi Data di R lebih mudah : Saat ini terjadi peningkatan jumlah yang cukup cepat, library visualisasi data pada R lebih besar dibandingkan pada Python.
Source : https://shivathudi.com/2017/04/19/data-visualization-in-r-using-ggplot-and-shiny/
  • R Shinny : Shinny adalah sebuah package yang memudahkan untuk membuat interaktif web untuk keperluan pengolahan dan visualisasi data.
Source : https://www.youtube.com/watch?v=YneLLtGcCus
  • RMarkdown : Rmarkdown memudahkan kita dalam membuat laporan data dan hasil analisa data-nya.
Source : http://r4ds.had.co.nz/r-markdown.html

Kedua bahasa pemrograman tersebut sebenarnya saling melengkapi, bukan saling menggantikan. Oleh karena itu program studi Magister Informatika UIN Maulana Malik Ibrahim Malang, dan melihat dari peluang, kebutuhan dan tuntutan kerja yang semakin meningkat pada bidang data science, maka mempelajari kedua bahasa pemrograman tersebut adalah esensial bagi mahasiswa Magister Informatika UIN Maulana Malik Ibrahim Malang yang ingin menjadi Data Scientist.

Daftar Pustaka :

Using R for Multivariate Analysis, artikel dapat dibaca pada URL :
https://little-book-of-r-for-multivariate-analysis.readthedocs.io/en/latest/src/multivariateanalysis.html#principal-component-analysis

Welcome to a Little Book of R for Biomedical Statistics!, buku dapat dibaca pada URL :
https://a-little-book-of-r-for-time-series.readthedocs.io/en/latest/

Metode Numerik Menggunakan R Untuk Teknik, buku dapat dibaca di URL :
https://bookdown.org/moh_rosidi2610/Metode_Numerik/

HealthyR: R for health data analysis
https://argoshare.is.ed.ac.uk/healthyr_book/


Statistical Inference via Data Science A ModernDive into R and the tidyverse
https://moderndive.com/index.html

Exploratory Data Analysis with R, buku dapat dibaca di URL :
https://bookdown.org/rdpeng/exdata/

Introduction to Data Science
https://ubc-dsci.github.io/introduction-to-datascience/

R for Data Science
https://r4ds.had.co.nz/

Data set udara bersih di US dapat diambil pada URL : https://www.epa.gov/outdoor-air-quality-data

Dataset for COVID-19: Digging a Bit Deeper
https://www.kaggle.com/abhinand05/covid-19-digging-a-bit-deeper

BOOKDOWN
https://bookdown.org/

Share your Shiny Applications Online
https://www.shinyapps.io/

Hands-On Programming with R
https://rstudio-education.github.io/hopr/

Bayesian Networks in R with Applications in Systems Biology
https://www.bnlearn.com/book-useR/

bnlearn – an R package for Bayesian network learning and inference
https://www.bnlearn.com/

Probabilistic Programming in Python
https://docs.pymc.io/

COVID-19 Study with Epidemiology models using python
https://www.kaggle.com/volpatto/covid-19-study-with-epidemiology-models

Median Age
https://worldpopulationreview.com/countries/median-age/

Dataset for The Holy Quran
https://www.kaggle.com/zusmani/the-holy-quran

Dataset for Crime Rate By Country
https://worldpopulationreview.com/countries/crime-rate-by-country/

Dataset for Sex (% Female)
https://data.worldbank.org/indicator/SP.POP.TOTL.FE.ZS

Dataset for Smooking
https://ourworldindata.org/smoking#prevalence-of-smoking-across-the-world

Dataset for World Bank national accounts data, and OECD National Accounts data files.
https://data.worldbank.org/indicator/NY.GDP.MKTP.CD

Data set dapat diambil pada URL :
http://archive.ics.uci.edu/ml/index.php

8 thoughts on “MENJADI DATA SCIENTIST HARUS BELAJAR DI MAGISTER INFORMATIKA UIN MAULANA MALIK IBRAHIM MALANG”

  1. Assalamu’alaikum. Prof, saya Arif Kurniwan, mahasiswa baru Magister Informatika UIN.
    Berarti intinya di mata kuliah matematika data science kita menggunakan Bahasa Pemrograman R dan menggunakan IDE RStudio serta framework Shiny gitu nggeh?
    Meskipun saya mengajar SMK jurusan RPL tapi jujur baru dengar tentang R language… Semoga bisa mengikuti.

      1. Siap Prof, saya barusan selesai download dan install Anaconda Navigator. untuk bahasa pemrograman Python dan R saya masih proses belajar, sebelumnya sudah pernah mencoba namun hanya bagian-bagian dasar nya saja.

Leave a Reply

Your email address will not be published. Required fields are marked *