Sqlite Üzerinde Veri Analizi
Total Page:16
File Type:pdf, Size:1020Kb
BLM442 Keşif aktivitesi-2: SQLite üzerinde veri analizi İsim/Soyisim: Ege Akman Öğrenci Numarası:150202058 E-mail:[email protected] Kullanılan dataset adı:LaLiga_dataset / LaLiga2 Dataset url:https://www.kaggle.com/spn007/la-liga-dataset / https://fbref.com/en/comps/12/1652/2017-2018-La-Liga- Stats İntihal: Netten alınacak kısmi kod parçaları önceden kod içinde/raporda belirtilmek ve soru sorulduğunda cevaplanması durumunda sıkıntı çıkarmayacaktır. (i) Internet kaynağını belirtmeyen/açıklayamayan/üzerinde geliştirme yapmayan veya (ii) birbirleriyle benzer/aynı çalışma teslim edenlerin aktiviteleri sıfır üzerinden değerlendirilecektir. KA-2 Gönderim şekli 1-pdf olarak "ogrenciNo.pdf" dokumanını gonderme -calisma dosyasında (File -> Print Preview) sonrası olusan html dosyasını yazdır deyip pdf olarak kaydetme veya -(File -> Download as -> HTML) seklinde indirip pdf'e cevirme http://html2pdf.com/ 2-(File -> Download as -> Notebook) indirip "ogrenciNo.ipynb" dokumanını gonderme [email protected] Problemlerinizin SELECT, WHERE, ORDER BY, SELECT TOP, LIKE, IN, BETWEEN, AS, INTERSECT, GROUP BY, HAVING, COUNT(), MIN() and MAX(), AVG(), SUM(), INNER JOIN, RIGHT (OUTER) JOIN, LEFT (OUTER) JOIN vs. keyword'lerinden birkaçını içermesini sağlayınız. Problem 1: Dosyayı import edin. In [1]: .mode csv .import LaLiga_dataset.csv LaLiga_dataset Problem 2: Veritabanından ilk 10 satırı gösteriniz. In [2]: .mode columns .headers on select * from LaLiga_dataset limit 10 season club home_win away_win home_loss away_loss matches_won matches_lost matches_drawn total_matches points home_goals away_goals goals_scored goals _conceded goal_difference ---------- ------------- ---------- ---------- ---------- ---------- ----------- ------------ ------------- ------------- ---------- ---------- ---------- ------------ -------------- ------ --------- 1970-71 Real Zaragoza 3 0 5 13 3 18 9 30 18 14 8 22 54 -32 1970-71 Elche 4 0 5 11 4 16 10 30 22 17 8 25 46 -21 1970-71 Las Palmas 5 0 3 12 5 15 10 30 25 25 8 33 42 -9 10 30 25 25 8 33 42 -9 1970-71 Sabadell 8 0 3 14 8 17 5 30 29 19 9 28 49 -21 1970-71 Espanyol 7 1 4 9 8 13 9 30 33 13 5 18 25 -7 1970-71 Sporting de G 9 1 4 11 10 15 5 30 35 29 6 35 44 -9 1970-71 CD Malaga 6 2 3 7 8 10 12 30 36 14 13 27 32 -5 1970-71 Granada 9 1 1 11 10 12 8 30 38 24 9 33 34 -1 1970-71 Real Sociedad 9 1 3 8 10 11 9 30 39 18 5 23 27 -4 1970-71 Sevilla 11 2 1 10 13 11 6 30 45 26 8 34 42 -8 Problem 3: 2011-12 sezonunda oynayan takımların istatistiklerini gösterin. In [3]: select * from LaLiga_dataset where season='2011-12'; season club home_win away_win home_loss away_loss matches_won matche s_lost matches_drawn total_matches points home_goals away_goals goals_scored goals_conceded goal_difference ---------- ------------------- ---------- ---------- ---------- ---------- ----------- -------- ---- ------------- ------------- ---------- ---------- ---------- ------------ -------------- --------------- 2011-12 Racing de Santander 3 1 9 10 4 19 15 38 27 11 17 28 63 -35 2011-12 Sporting de Gijon 7 3 8 13 10 21 7 38 37 24 18 42 69 -27 2011-12 Villarreal 6 3 3 12 9 15 14 38 41 26 13 39 53 -14 2011-12 Granada 8 4 6 14 12 20 6 38 42 22 13 35 56 -21 2011-12 Real Zaragoza 8 4 7 12 12 19 7 38 43 19 17 36 61 -25 2011-12 Rayo Vallecano 8 5 10 11 13 21 4 38 43 29 24 53 73 -20 2011-12 Espanyol 9 3 6 10 12 16 10 38 46 31 15 46 56 -10 2011-12 Getafe 8 4 5 10 12 15 11 38 47 24 16 40 51 -11 2011-12 Betis 7 6 5 12 13 17 8 38 47 28 19 47 56 -9 2011-12 Real Sociedad 9 3 4 11 12 15 11 38 47 29 17 46 52 -6 2011-12 Athletic Club 8 4 4 9 12 13 13 38 49 29 20 49 52 -3 2011-12 Sevilla 9 4 6 8 13 14 11 38 50 32 16 48 47 1 2011-12 Mallorca 9 5 5 9 14 14 10 38 52 21 21 42 46 -4 2011-12 Osasuna 10 3 3 7 13 10 15 38 54 26 18 44 61 -17 2011-12 Levante 11 5 5 10 16 15 7 38 55 33 21 54 50 4 2011-12 Atletico de Madrid 11 4 3 9 15 12 11 38 56 36 17 53 46 7 2011-12 Malaga 13 4 3 11 17 14 7 38 58 35 19 54 53 1 2011-12 Valencia 11 6 4 7 17 11 10 38 61 40 19 59 44 15 2011-12 Barcelona 17 11 1 2 28 3 7 38 91 73 41 114 29 85 2011-12 Real Madrid 16 16 1 1 32 2 4 38 100 70 51 121 32 89 Problem 4: 2008-09 sezonunda 70 ten fazla puan toplayan takımların istatistiklerini gösteriniz. In [4]: select * from LaLiga_dataset where season='2008-09' and points>70 season club home_win away_win home_loss away_loss matches_won matches_lost matches_drawn total_matches points home_goals away_goals goals_scored goals_conceded goa l_difference ---------- ----------- ---------- ---------- ---------- ---------- ----------- ------------ -- ----------- ------------- ---------- ---------- ---------- ------------ -------------- -------- ------- 2008-09 Real Madrid 14 11 3 7 25 10 3 38 78 49 34 83 52 31 2008-09 Barcelona 14 13 2 3 27 5 6 38 87 61 44 105 35 70 Problem 5: Madrid takımlarının(içinde Madrid geçen) 2010-11 sezonunda aldıkları puanları listeleyiniz. In [5]: select season,club,points from LaLiga_dataset where season='2010-11' and club like "%Madrid%"; season club points ---------- ------------------ ---------- 2010-11 Atletico de Madrid 58 2010-11 Real Madrid 92 Problem 6: Takımların averaj koşullarına göre performans değerlendirmelerini yazınız. In [6]: SELECT season, club,goal_difference, CASE WHEN goal_difference<0 THEN 'BAŞARISIZ' WHEN goal_difference<30 THEN 'ORTA' WHEN goal_difference<80 THEN 'BAŞARILI' END AS PERFORMANS FROM LaLiga_dataset where season='2010-11'; season club goal_difference PERFORMANS ---------- ---------- --------------- ---------- 2010-11 Almeria -34 BAŞARISIZ 2010-11 Hercules -24 BAŞARISIZ 2010-11 Deportivo -16 BAŞARISIZ 2010-11 Mallorca -15 BAŞARISIZ 2010-11 Getafe -11 BAŞARISIZ 2010-11 Getafe -11 BAŞARISIZ 2010-11 Real Socie -17 BAŞARISIZ 2010-11 Real Zarag -13 BAŞARISIZ 2010-11 Levante -11 BAŞARISIZ 2010-11 Racing de -15 BAŞARISIZ 2010-11 Malaga -14 BAŞARISIZ 2010-11 Sporting d -7 BAŞARISIZ 2010-11 Osasuna -1 BAŞARISIZ 2010-11 Espanyol -9 BAŞARISIZ 2010-11 Sevilla 1 ORTA 2010-11 Athletic C 4 BAŞARILI 2010-11 Atletico d 9 2010-11 Villarreal 10 ORTA 2010-11 Valencia 20 ORTA 2010-11 Real Madri 69 BAŞARILI 2010-11 Barcelona 74 BAŞARILI Problem 7: Kulüplerin 1970-1971 sezonundan 2016-2017 sezonları arasında kaç sezon LaLigada oynadıklarını gösteriniz. In [7]: SELECT club, COUNT(season) FROM LaLiga_dataset GROUP BY club; club COUNT(season) ---------- ------------- AD Almeria 2 Alaves 7 Albacete 7 Almeria 6 Athletic C 47 Atletico d 45 Barcelona 47 Betis 36 Burgos 6 CD Malaga 12 Cadiz 12 Castellon 5 Celta de V 31 Compostela 4 Cordoba 2 Deportivo 26 Eibar 3 Elche 10 Espanyol 45 Extremadur 2 Getafe 12 Gimnastic 1 Granada 12 Hercules 12 Las Palmas 20 Leganes 1 Levante 9 Lleida 1 Logrones 9 Malaga 16 Mallorca 22 Merida 2 Murcia 10 Numancia 4 Osasuna 29 Racing de 28 Rayo Valle 17 Real Burgo 3 Real Madri 47 Real Ovied 16 Real Socie 44 Real Zarag 39 Recreativo 5 Sabadell 4 Salamanca 12 Sevilla 41 Sporting d 33 Tenerife 12 Valencia 46 Valencia 46 Valladolid 28 Villarreal 17 Xerez 1 Problem 8: Takımların LaLiga gol ortalamalarını gösteriniz. In [17]: SELECT club, AVG(goals_scored) AS OrtGol FROM LaLiga_dataset GROUP BY club; club OrtGol ---------- ---------- AD Almeria 35.5 Alaves 41.4285714 Albacete 45.7142857 Almeria 40.6666666 Athletic C 49.8936170 Atletico d 56.9333333 Barcelona 76.0 Betis 44.7222222 Burgos 36.0 CD Malaga 30.75 Cadiz 32.5833333 Castellon 32.4 Celta de V 42.0 Compostela 49.75 Cordoba 27.0 Deportivo 49.2692307 Eibar 46.3333333 Elche 32.4 Espanyol 44.0666666 Extremadur 31.0 Getafe 43.3333333 Gimnastic 34.0 Granada 33.75 Hercules 35.5833333 Las Palmas 42.1 Leganes 36.0 Levante 38.8888888 Lleida 29.0 Logrones 32.3333333 Malaga 47.1875 Mallorca 45.1818181 Merida 35.0 Murcia 33.2 Numancia 38.75 Osasuna 39.0689655 Racing de 41.9285714 Rayo Valle 44.7058823 Real Burgo 33.6666666 Real Madri 76.1489361 Real Ovied 41.3125 Real Socie 48.5 Real Zarag 47.0769230 Recreativo 40.4 Sabadell 30.0 Salamanca 35.4166666 Sevilla 49.2439024 Sporting d 41.9090909 Tenerife 48.8333333 Valencia 53.9565217 Valladolid 40.0 Villarreal 52.4705882 Xerez 38.0 Problem 9: 2007-2008 sezonunda 40tan fazla gol atan takımları filtreleyiniz. In [21]: SELECT season, club, goals_scored FROM LaLiga_dataset where season='2007-08' GROUP BY club HAVING goals_scored >=40; season club goals_scored ---------- ---------- ------------ 2007-08 Almeria 42 2007-08 Athletic C 40 2007-08 Atletico d 66 2007-08 Barcelona 76 2007-08 Betis 45 2007-08 Deportivo 46 2007-08 Espanyol 43 2007-08 Getafe 44 2007-08 Mallorca 69 2007-08 Racing de 42 2007-08 Real Madri 84 2007-08 Real Zarag 50 2007-08 Recreativo 40 2007-08 Sevilla 75 2007-08 Valencia 48 2007-08 Valladolid 42 2007-08 Villarreal 63 Problem 10: 2017-2018 yılında LaLigadaki takımların istatistiklerini gösteren veritabanını import et In [25]: .mode csv .import LaLiga2.csv LaLiga2 .mode columns Problem 11: 2017-18 sezonunun puan durumunu gösteriniz. In [26]: select Rk,squad from LaLiga2 Rk Squad ---------- ---------- 1 Barcelona 2 Atlético M 3 Real Madri 4 Valencia 5 Villarreal 6 Real Betis 7 Sevilla 8 Getafe 9 Eibar 10 Girona 11 Espanyol 12 Real Socie 13 Celta Vigo 14 Alavés 15 Levante 16 Athletic B 17 Leganés 18 Deportivo 19 Las Palmas 20 Málaga Problem 12: İki veri setini birleştiriniz.