MGT-502 Data Science and Machine Learning

Lab Content:

Week1: Data acquisition: Web scraping, Calling Internet APIs
Week2: Linear Regression: Multivariate linear regression, Polynomial regression, Regularization (Lasso, Ridge), Cross validation, Train-Test split, MAE, MSE
Week3: Classification 1: Logistic regression, Accuracy, Confusion Matrix, Precision, Recall, F1-score
Week4: Classification 2: KNN Classifier, Decision Trees
Week 5: Clustering: K-Means, Hierarchical clustering, Dendrogram
Week 6: Association Rules: Association rule mining, Apriori algorithm
Week 7: Recommender systems: User-User Collaborative Filtering (from scratch and using Surprise library), Mean-centered cosine similarity, Precision and Recall at rank k, Precision-recall curve
Week 8: Text analytics: Text preparation (Tokenization, Lemmatization, Stopwords), Text representation (Bag of Words, TF-IDF), Text structure (Dependency Parsing, Entity recognition), Text similarity (cosine similarity)
Week 9: Text analysitics 2: Text embeddings, Bag of Words, TF-IDF, Word2vec, application to text classification

For the project, you will have to work with Git and GitHub. The following documentation can be useful to you:

Name		Name	Last commit message	Last commit date
Latest commit History 64 Commits
01_Data_acquisition_API		01_Data_acquisition_API
02_Regression		02_Regression
03_Classification		03_Classification
04_Classification-2		04_Classification-2
05_Clustering		05_Clustering
06_Association-Rules		06_Association-Rules
07_Recommenders		07_Recommenders
08_Text-analytics		08_Text-analytics
09_Text-analytics-2		09_Text-analytics-2
10_Neural-Nets		10_Neural-Nets
Assignment		Assignment
data		data
README.md		README.md