Кейс про ЕГЭ

В этом задании Вам предстоит выполнить роль аналитика данных в области образования.

Заказчик (руководство вуза) предоставил обезличенные данные с баллами ЕГЭ студентов (stud_spisok_ege.csv) и сведения о баллах за контрольные работы (stud_spisok_ball.csv).

Анализ этих данных позволит руководству вуза принимать обоснованные решения по повышению качества процесса обучения и выстраивать персональные образовательные маршруты (построить рекомендательную систему на основе искусственного интеллекта).

import pandas as pd

url = "https://raw.githubusercontent.com/dm-fedorov/pandas_basic/master/data/data_stud/stud_spisok_ege.csv"

df = pd.read_csv(url, sep=';')
df.head()
stud_kod predmet_name ball year svid_status
0 50095 Русский язык 76 2013 Действительно
1 50095 Английский язык 94 2013 Действительно
2 50095 Математика 56 2013 Действительно
3 50095 Обществознание 70 2013 Действительно
4 50104 Русский язык 72 2013 Действительно
import pandas as pd

url = "https://raw.githubusercontent.com/dm-fedorov/pandas_basic/master/data/data_stud/stud_spisok_ball.csv"

df = pd.read_csv(url, sep=';')
df.head()
stud_kod uch_plan_kod predmet_name ball ts cd_nomer semestr cd_type_name uch_plan_punkt_kod
0 8 1 История 25 25-дек-11 1 1 Эссе 255
1 8 1 История 30 25-дек-11 2 1 Презентация 255
2 8 1 История 45 NaN 3 1 Аналитическая работа 255
3 8 1 Философия 15 30-апр-15 2 1 Реферат 293
4 8 1 Философия 18 30-апр-15 1 1 Аналитическая работа 293

Задача 1: определите, всего сколько студентов представлено в наборе данных.

Задача 2: определите по данным ЕГЭ те предметы, которые чаще всего сдают абитуренты в этом вузе.

Задача 3: определите средние, минимальные и максимальные баллы ЕГЭ по отдельным предметам.

Задача 4: определите годы с максимальными и минимальными показателями ЕГЭ.

Задача 5: определите наиболее часто встречающийся вид контрольной работы в вузе.

Задача 6: определите дисциплину(ы), вызвавшую наибольшие сложности у студентов.

Это позволит усилить подготовку по данным дисциплинам через внедрение факультативных занятий.

Задача 7: определите отстающих студентов (претендентов на отчисление).

Задача 8: определите семестр и год, наиболее сложные для отдельных (выбранных) студентов.

Задача 9: определите, можно ли провести анализ интересов отдельных (выбранных) студентов, исходя из баллов по контрольным работам.

Эта информация позволит в будущем рекомендовать студентам подходящие магистерские программы.

Задача 10: Предложите решение, каким образом по представленным данным отследить динамику успеваемости отдельных (выбранных) студентов?