What Is KNIME? What Is KNIME?
Total Page:16
File Type:pdf, Size:1020Kb
What is KNIME? What is KNIME? • KNIME = Konstanz Information Miner • Developed at University of Konstanz in Germany • Desktop version available free of charge (Open Source) • Modular platform for building and executing workflows using predefined components, called nodes • Functionality available for tasks such as standard data mining, data analysis and data manipulation • Extra features and functionalities available in KNIME by extensions • Written in Java based on the Eclipse SDK platform KNIME เป็น Analytic Platform แบบ Open Source ที่ได้รับการจัด อันดับจาก Gartner (ประกาศเมื่อ เดือน Jan 2019) อยู่ในกลุ่ม Leader ด้าน Data Science & Machine Learning มาหลายปีติดกัน KNIME เป็น Data driven software ที่ทําอะไรได้ก็ได้ เช่น Text mining, Image processing, สามารถเชื่อมกับภาษา Python, R, Spark H2O, Keras/TensorFlow for Deep Learning ได้อย่างลื่นไหล KNIME Software Overview KNIME resources https://www.knime.com What can you do with KNIME? Data manipulation and analysis File & database I/O, filtering, grouping, joining, .... Data mining / machine learning WEKA, R, Interactive plotting Scripting Integration R, Perl, Python, Matlab ... Much more Bioinformatics, text mining and network analysis Data Visualization Nodes Inner Join Exercise-1 Data Manipulation • Columns: • binning • replace • filters missing values • Rows: • filtering • sampling • partitioning • Matrix: • Transpose Exercise-2 Data Transformation String Manipulation Exercise-3 String Manipulation Connect to Database Write to Database Exercise-4 Missing Value Detect Outliers Source :: https://towardsdatascience.com/a-brief-overview-of-outlier-detection-techniques Detect Outliers Source :: https://towardsdatascience.com/a-brief-overview-of-outlier-detection-techniques Detect Outliers Predictive Analytic Process http://www.proglobalbusinesssolutions.com/six-steps-in-crisp-dm-the-standard-data-mining-process/ Churn prediction Churn prediction หรือ การทํานาย ลักษณะลูกค้าที่กําลังจะยกเลิกบริการ churn คือ การที่ลูกค้า สมาชิก (Subscribers) หรือ ผู้ใช้งาน (Users) ที่ซื้อสินค้าหรือใช้บริการอยู่ หรือ มีการซื้อหรือใช้บริการอยู่เป็นประจํา เกิด เปลี่ยนใจหยุดใช้หยุดซื้อ หรือ ยกเลิก บริการกับคุณ ตัดสินใจยกเลิกสัญญา https://www.brandingchamp.com/customer-churn-%E0%B8%84%E0%B8%B7%E0%B8%AD-%E0%B8%AD%E0%B8%B0%E0%B9%84%E0%B8%A3/ Churn prediction 2 Steps 1. Training Model 2. Deploy Model • Customer Data • ContractData.csv • Operation Data • CallsData.xlsx Churn = 0 customer remained with contract Churn = 1 customer quit contract Churn prediction Churn prediction Churn prediction Churn prediction Churn prediction Churn prediction Train Model Churn prediction Train Model Churn prediction Evaluate Model Churn prediction Churn prediction Evaluate Model Score the Model Remember to use the Predictor node appropriate for your model! Evaluate predictions based on confusion matrix and ROC. ROC Curve ROC curve ย่อมาจาก Receiver operating characteristic curve Churn prediction Deploy Model Churn prediction Training Video.