В этом задании Вам предстоит выполнить роль аналитика данных в области образования.
Заказчик (руководство вуза) предоставил обезличенные данные с баллами ЕГЭ студентов (stud_spisok_ege.csv) и сведения о баллах за контрольные работы (stud_spisok_ball.csv).
Анализ этих данных позволит руководству вуза принимать обоснованные решения по повышению качества процесса обучения и выстраивать персональные образовательные маршруты (построить рекомендательную систему на основе искусственного интеллекта).
import pandas as pdurl ="https://raw.githubusercontent.com/dm-fedorov/pandas_basic/master/data/data_stud/stud_spisok_ege.csv"df = pd.read_csv(url, sep=';')df.head()
stud_kod
predmet_name
ball
year
svid_status
0
50095
Русский язык
76
2013
Действительно
1
50095
Английский язык
94
2013
Действительно
2
50095
Математика
56
2013
Действительно
3
50095
Обществознание
70
2013
Действительно
4
50104
Русский язык
72
2013
Действительно
stud_kod - идентификатор студента
predmet_name - имя предмета
ball - балл
year - год сдачи
svid_status - статус свидетельства о сдаче ЕГЭ
import pandas as pdurl ="https://raw.githubusercontent.com/dm-fedorov/pandas_basic/master/data/data_stud/stud_spisok_ball.csv"df = pd.read_csv(url, sep=';')df.head()
stud_kod
uch_plan_kod
predmet_name
ball
ts
cd_nomer
semestr
cd_type_name
uch_plan_punkt_kod
0
8
1
История
25
25-дек-11
1
1
Эссе
255
1
8
1
История
30
25-дек-11
2
1
Презентация
255
2
8
1
История
45
NaN
3
1
Аналитическая работа
255
3
8
1
Философия
15
30-апр-15
2
1
Реферат
293
4
8
1
Философия
18
30-апр-15
1
1
Аналитическая работа
293
stud_kod - идентификатор студента
uch_plan_kod - внутренний код учебного плана
predmet_name - имя дисциплины по учебному плану
ball - балл за контрольную работу
ts - время, когда оценка внесена в систему
cd_nomer - номер контрольной работы, если их несколько за семестр
semestr - семестр
cd_type_name - вид контрольной работы
uch_plan_punkt_kod - идентификатор учебного плана
Задача 1: определите, всего сколько студентов представлено в наборе данных.
Задача 2: определите по данным ЕГЭ те предметы, которые чаще всего сдают абитуренты в этом вузе.
Задача 3: определите средние, минимальные и максимальные баллы ЕГЭ по отдельным предметам.
Задача 4: определите годы с максимальными и минимальными показателями ЕГЭ.
Задача 5: определите наиболее часто встречающийся вид контрольной работы в вузе.
Задача 6: определите дисциплину(ы), вызвавшую наибольшие сложности у студентов.
Это позволит усилить подготовку по данным дисциплинам через внедрение факультативных занятий.
Задача 7: определите отстающих студентов (претендентов на отчисление).
Задача 8: определите семестр и год, наиболее сложные для отдельных (выбранных) студентов.
Задача 9: определите, можно ли провести анализ интересов отдельных (выбранных) студентов, исходя из баллов по контрольным работам.
Эта информация позволит в будущем рекомендовать студентам подходящие магистерские программы.
Задача 10: Предложите решение, каким образом по представленным данным отследить динамику успеваемости отдельных (выбранных) студентов?