Разработка методологии создания и прототипа рекомендательной системы

Работа добавлена:



Если Вы нашли нужный Вам реферат или просто понравилась коллекция рефератов напишите о Нас в любой соц сети с помощью кнопок ниже





Разработка методологии создания и прототипа рекомендательной системы на http://mirrorref.ru

Содержание

  • Содержание
  • Введение
  • Глава 1 Теоретическая часть и основные понятия
  • Образование
  • Образовательный процесс
  • Высшее образование
  • Массовые открытые онлайн-курсы
  • Наем сотрудников
  • Процесс
  • Сайты по поиску работы и проблемы сбора информации
  • Методы монетизации интернет-проектов
  • Рекомендательные системы
  • Понятие рекомендательной системы
  • История
  • Классификация и принцип действия методов фильтрации
  • Лучшие практики
  • Глава 2 Рекомендательные сервисы
  • Анализ потребителей
  • Анализ потребителей: студенты
  • Анализ потребителей: компании
  • Анализ потребителей: массовые открытые онлайн-курсы и учреждения дополнительного образования
  • Алгоритм
  • Тип фильтрации
  • Ранжирование
  • Реализация
  • Принцип
  • Необходимые данные и проблемы, связанные с их сбором
  • Персональные данные студента
  • Информация о базовых курсах
  • Информация о курсах на сторонних площадках
  • Список требований работодателя
  • Информация о действиях студентов и обратная связь от них
  • Решение проблемы «холодного старта»
  • Процесс сбора информации
  • Как связать с существующей системой
  • Требования к интерфейсу
  • Монетизация
  • Глава 3
  • Пользовательский интерфейс: студенты
  • Пользовательский интерфейс: компании
  • Пользовательский интерфейс: МООК
  • Заключение
  • Список использованной литературы

Введение

Мы живем в информационном обществе, где информационные технологии являются не просто инструментом или удобством, а необходимостью. Ни одна сфера нашей жизни не обошлась без использования вычислительной техники: она используется в торговле, производстве, добыче полезных ископаемых, бизнесе, для повседневных нужд. Технологии заменили человека во многих областях: в вычислениях, хранении информации, ее поиска и обработки. Однако лицом, ответственным за принятие решений до сих пор является человек, то есть после того, как все необходимые подготовительные этапы сделаны, именно он решает, что будет сделано на следующих этапах.

Принятие правильного решения напрямую зависит от полноты информации, которой обладает пользователь, то есть, чем более полной информацией располагает человек, тем выше вероятность принять решение, которое удовлетворит всем требованиям, предпочтениям, будет эффективным. Более того, важно не только получить такую информацию, а преобразовать ее в данные, то есть проверить ее достоверность и упорядочить таким образом, чтобы она стала пригодна для восприятия и машинной обработки. Для этого используются поисковые системы, основанные на индексации, то есть не, которые оценивают достоверность и «репутацию» источника, полагаясь на количество ссылок на него и частоту упоминаний.

На сегодняшний день в условиях информационного взрыва нас окружает такое огромное количество информации, что не представляется возможным ориентироваться во всем ее многообразии. Помимо обилия источников и объема данных, имеет место дублирование информации (многократное упоминание одних и тех же сведений в различных источниках) и распространение ложной информации (подлог). Даже если избежать дублирования и ложные сведения, то такой объем слишком сложно усвоить и обработать человеку. Инструментом, призванным помочь пользователю в данном вопросе, является технология рекомендательных систем. Такие системы позволяют отобрать из всего многообразия опций и информации только те, которые будут максимально привлекательны для конкретного пользователя, предсказывая его поведение на основе действий, выполненных в прошлом как им самим, так и другими пользователями системы. Таким образом, можно сказать, что данный тип систем является самообучающимся, то есть по мере того, как увеличивается количество информации в системе, предсказания становятся более точными, а значит, растет уровень удовлетворения пользователя. На данный момент можно лицезреть активное применение данной технологии в коммерции, в частности в интернет-магазинах, потоковых сервисах и социальных сетях. Это вызвано тем, что работа рекомендательных систем – трудоемкий процесс, который требует вложения не только сил, но и средств, а данные области генерируют прибыль, часть которой может тратиться на поддержание работоспособности таких систем. Подобный сервис, реализованный в образовательной среде, мог бы помочь студентам и выпускникам с построением их образовательных траекторий и будущих карьер. Таким образом актуальность и новизна моей работы банально заключается в том, что аналогичных проектов просто нет.

Цель работы – разработка методологии создания и прототипа рекомендательной системы, обозначение предпосылок для ее создания, предназначенной для подбора курсов в рамках университета и за его пределами, учитывая предпочтения студента и требования работодателей.

Ключевая задача – разработка алгоритма работы и прототипа интерфейса рекомендательной системы, который бы удовлетворял требованиям, описанным в цели работы.

В рамках моей работы необходимо выполнить следующие задачи:

  • Исследование теоретических аспектов изучаемых областей (традиционного и онлайн образования, найма сотрудников, рекомендательных систем);
  • Анализ сегментов потребителей (входы и выходы системы);
  • Разработка бизнес-плана проекта;
  • Выбор типа рекомендательной системы;
  • Разработка прототипа интерфейса рекомендательной системы, которая бы удовлетворяла потребностям потребителей.

Основными источниками информации в моей работе служат печатные и онлайн версии исследований, опубликованные в периодических изданиях, посвященные образованию, рекомендательным системам и процессу найма кадров в компаниях.

Глава1 является обоснованием выбранной темы, где представлены теоретические основы изучаемой и смежных областей, определения ключевых понятий, необходимых для понимания и выполнения работы. Эта глава описывает предпосылки для создания автоматизированной системы, которая бы служила «связующим звеном» между бизнесом и его стремлением найти квалифицированные кадры и студентами, которые стремятся быть трудоустроенными и занимать конкретные должности или работать в определенной сфере.

Глава 2 описывает исследовательскую часть работы, где описываются конкретные «узкие места» в процессе найма и подготовки кадров, исследование сегментов потенциальных потребителей разрабатываемого сервиса, выстраивается методология проектирования и создания сервиса, пути его монетизации и требования к проекту.

Глава 3 посвящена разработке прототипа пользовательского интерфейса сервиса, описанию его основных элементов, функций и особенностей для разных сегментов потребителей.

Глава 1 Теоретическая часть и основные понятия

Образование

Образовательный процесс

Исходя из определения, представленного в Советской Энциклопедии, «Учебный процесс - система организации учебно-воспитательной деятельности … направлен на достижение целей обучения и воспитания. Определяется учебными планами, учебными программами».(Большая советская энциклопедия, 1969-1978).

Таким образом, можно заключить, что учебный процесс это регламентированный специальными документами комплекс действий, направленный на передачу знаний. Однако, данный регламент не всегда оказывается столь жестким: в последнее время все больше учебных заведений приходят к системе индивидуальных учебных планов, где студент должен сам выбирать некоторые дисциплины из предложенных альтернатив. Таким образом образование перестает становится более индивидуальным, что открывает новые возможности перед студентами: кроме «базовой» части учебного плана студенты могут выбрать те дисциплины, которые позволят им обрести те компетенции, в которых они нуждаются, но данное преимущество имеет место только при условии верного выбора предметов, понимания их сути еще до начала изучения.

Цель студента в процессе образования - стать специалистом, то есть приобрести определенные знания и навыки, компетенции и по итогам проделанной работы занять определенную должность. Для этого необходимо соответствовать определенным требованиям работодателя. Казалось бы, достаточно просто сопоставить требования конкретной вакансии и умения, которыми располагает конкретный человек, но это представляется возможным только «по факту». Студент, выбирая ту или иную дисциплину, не имеет полного представления о том, что она ему даст, какие навыки и знания он приобретет в процессе изучения данного материала. При выборе той или иной дисциплины студенты вынуждены руководствоваться названием курса и учебным планом, который часто не слишком подробный и не описывает состав курса в достаточной мере.

Высшее образование

Образование, по мнению Сергея Ивановича Ожегова, это «получение систематизированных знаний и навыков, обучение, просвещение» (Ожегов, 2015).

Как и упоминалось ваше, при получении высшего образования студент рассчитывает овладеть определенными знаниями и умениями, однако образовательные программы в последнее время становятся все более и более гибкими, что с одной стороны позволяет получить более прикладные и нужные по мнению студента компетенции, с другой – вынуждает студента делать выбор, от которого многое зависит, возлагая на него дополнительную ответственность.

Ситуацию в высшем образовании я решил разобрать на примере НИУ ВШЭ, одного из ведущих университетов страны, который использует самые передовые по меркам страны методики обучения.

На каждой образовательной программе в НИУ ВШЭ помимо базового курса, включающего дисциплины, которые посещают все студенты, в программу входят дисциплины по выбору, когда студенту предоставляется блок предметов одной области, состоящий из 2 и более альтернатив, и предлагается выбрать интересующую.

Почему такой выбор настолько важен?

Во-первых, каждая дисциплина отвечает за развитие конкретных компетенций, то есть каждый выбор влияет на итоговый набор компетенций, с которым студент покинет стены высшего учебного заведения и пойдет устраиваться на работу.

Во-вторых, то, насколько тот или иной курс нравится студенту, напрямую влияет на мотивацию студента, а значит и преподавателя, так, если дисциплина не оправдает ожиданий студента, то его мотивация снизится, он будет меньше сил и времени тратить на изучение материалов, может страдать посещаемость, и оценка преподавания, которую студенты обязаны проходить по окончании курса, хоть вины преподавателя в этом и нет. Следовательно, мотивация преподавателя снижается, так как общая заинтересованность в его предмете падает, ввиду того, что нужные студенты не выбрали этот курс, а те, кто выбрал, сделали это «ошибочно».

Однако, что влияет на правильность выбора дисциплины у студента? Как и любое лицо, принимающее решение (ЛПР), студент должен обладать как можно полной информацией о том, что из себя представляет каждая из опций, чтобы оценить полезность и конкурентные преимущества каждой. Информацию о дисциплине студент может найти в программе дисциплины, которая представляет из себя достаточно объемный документ, понимание которого бывает затруднительно. Данный документ не всегда достаточно детально описывает то, что будет изучено в процессе обучения, но главное, для студента оказывается загадкой прикладное значение того или иного предмета, где он может пригодиться, пригодится ли знание этой дисциплины на конкретной должности в конкретной компании.

Таким образом, при выборе курса следует учитывать, как интересы студента, чтобы мотивировать его к обучению, так и практическую пользу, которую данный студент получит, сделав этот выбор (Wang, 2008). Для решения таких задач отлично подходит технология индексации информации, чтобы стало возможным ранжировать выдачу для пользователя, осуществлять фильтрацию, сравнивать результаты и составлять рекомендации. Подробнее это будет рассмотрено во второй главе.

Массовые открытые онлайн-курсы

Массовый открытый онлайн-курс (МООК) — обучающий курс с массовым интерактивным участиемc применением технологий электронного обучения и открытым доступом через Интернет, одна из форм дистанционного образования.

Образовательный процесс на таких платформах проходит с использованием видеоматериалов (запись лекций), презентаций, аудиоматериалов и интерактивных заданий для закрепления пройденного материала.

Отличительной особенностью МООК является доступ к интерактивным форумам, где можно общаться с другими студентами, обмениваться опытом, задавать вопросы экспертам, преподавателям, проверка заданий выполняется системой и, порой, другими студентами, если задание предполагает открытый развернутый ответ (McAuley, 2010).

История массовых открытых онлайн-курсов берет свое начало в конце 1990-х годов, когда на специальных порталах стали записи лекций разных учебных. Однако данное явление предполагало только потребление контента, отсутствовала система контроля знаний, сертификация, были популярны форумы, где велось обсуждение различных тем и можно было проконсультироваться со знающими людьми, однако они были не систематизированы и нельзя было быть уверенным, что данный человек является специалистом. Все эти проблемы были решены с приходом и развитием МООК.

Массовые открытые онлайн-курсы получили распространение и завоевали популярность только середине 2010-х годов, так как дали возможность удобного общения студентов и преподавателей, а также дистанционной сдачи экзаменов и получения сертификата о прохождении курса. Подобные сайты подойдут всем: от начинающих, желающих ознакомиться с предметом и понять, насколько это им интересно, до специалистов, стремящихся расширить свои познания, освежить знания, применить на практике, получить сертификат. Немаловажно, что большинство курсов на подобных платформах доступны совершенно бесплатно или за несравнимо с традиционными курсами низкую цену.

Основной проблемой МООК считается то, что они не пользуются большим доверием, так как из-за того, что отсутствует очная форма обучения и сдача экзаменов, есть вероятность фальсификации, например, за студента может сдать экзамен его преподаватель, ему могут подсказывать, от может пользоваться литературой или материалами. В связи с этим можно сделать вывод, что данный вид образования рассчитан на самообразование, когда студент в первую очередь заинтересован в получении знаний и умений, а не документа или оценки.

В итоге, массовые открытые онлайн-курсы являются прекрасным способом получения дополнительного образования в дополнение к основному образованию или во время его получения, так как МООК являются дешевой, но очень качественной альтернативой традиционным (очным) курсам, где студент должен лично являться в определенное место в определенное время. В то же время они не могут в полной мере заменить образование, так как сертификаты МООК не пользуются высоким доверием в профессиональной среде.

Наем сотрудников

Процесс

Цель найма персонала – нахождение соответствия между профессиональными и личными характеристиками кандидата и критериями к вакантной должности.

Обычно наем персонала проходит в 9 этапов (Наем персонала: методы и технологии, 2017):

  1. Определение потребности компании в работниках в конкретный промежуток времени;
  2. Оформление заявки на поиск кадров, формирование перечня требований к кандидату, основываясь на текущей ситуации на рынке труда;
  3. Создание объявления о вакансии;
  4. Составление списка инструментов для поиска кадров (каналы распространения, поиск в конкретных организациях, сообществах и т.д.);
  5. Публикация вакансии;
  6. Анализ заявок и первичный отбор кандидатов;
  7. Поиск максимально подходящего кандидата, проведение специализированных мероприятий (собеседования, испытания, тестирование);
  8. Решение о найме кандидата, предложение условий;
  9. Адаптация сотрудника в коллективе и на производстве.

Важно заметить, что компания имеет влияние на данный процесс на всем его протяжении, хоть и в разной мере, однако она не может повлиять на уровень подготовки соискателей, ей приходится работать «с тем, что есть».

Такое положение дел связано с тем, что соискатели получают доступ к информации о требованиях только на шестом этапе, то есть после публикации вакансии, в которой описано, какие компетенции необходимы, чтобы занять конкретную должность.

Наем неподготовленных кадров невыгоден для компании, так как, чтобы получить работника нужной квалификации, компания должна потратить средства, время и ресурсы на переобучение сотрудника. Нужно понимать, что практически любая нетривиальная должность требует обучение кадров, однако речь тут идет о нюансах, а не о масштабном переобучении. Однако, порой компании вынуждены обучать сотрудников практически с нуля тому, что они могли освоить в процессе получения образования, но сделали неверный выбор или не уделили должного внимания.

В то же время сотрудник во время обучения получает только часть заработной платы, которая соответствует позиции, или же не получает ее вообще, работая на условиях неоплачиваемой стажировки. Более того, соискатель тратит больше времени на поиск работы из-за неполного соответствия требованиям работодателя, а, найдя работу, тратит на обучение время, которое мог бы работать или тратить по собственному усмотрению.

В результате всего вышесказанного в данном разделе делаем вывод, что ситуация, когда кандидат максимально удовлетворяет требованиям работодателя выгодна для обеих сторон, все экономят время, ресурсы и средства. Однако такая ситуация возможна только если студент будет располагать информациях о требованиях к кандидату на должность как можно раньше, чтобы подготовиться как можно лучше и потратить минимум ресурсов на подготовку и обучение после трудоустройства. И на сегодняшний день не существует сервиса, который бы помог решить данную проблему.

Сайты по поиску работы и проблемы сбора информации

На сегодняшний день самым популярным инструментом для поиска кадров являются рекрутинговые порталы, такие как «hh.ru» и «superjob.ru». широкое распространение они получили из-за того, что для пользователей они совершенно бесплатны, что обеспечивает большую аудиторию, позволяющую найти нужных сотрудников в кратчайшие сроки. Ко всему прочему сервис очень удобен и понятен, как соискателям, так и работодателям.

История поиска кадров через интернет в России началась в конце 1990-х годов, однако в то время резюме находились в свободном доступе, что затрудняло поиск высококвалифицированных кадров, редких специалистов. Ситуация резко изменилась после запуска проекта «NationalJobClub», который в 2003 году был переименован в «HeadHunter», данный сервис зарабатывает не на рекламе, а на том, что дает работодателям доступ к базам резюме за деньги. На данный момент на сайте размещено более 5 млн резюме и более 132 тыс. вакансий.

Таким образом, если нам нужна какая-либо статистика или информация об имеющихся на рынке вакансиях, то подобные порталы могут быть отличным источником информации, однако не все так просто: из-за большой популярности таких порталов модерация является сложной задачей, что, в свою очередь, приводит к снижению качества и достоверности информации. В базе имеют место повторы вакансий, которые работодатель делает, чтобы привлечь больше внимания к вакансии, а сбор данных осложнён тем, что процент метаданных в вакансии невелик.

Главная проблема сбора информации с сайтов поиска работы состоит в том, что информация там не формализована, поля заполняются в свободной форме, а, значит, не могут служить метаданными без первичной обработки. Для того, чтобы выяснить слабые места, я попробовал собрать данные с одного из сайтов резюме.

Осуществить поиск по области деятельности, уровню заработной платы или опыту работы достаточно просто, это позволяет сделать функционал сайта, так как данные поля заполняются значениями из фиксированного списка, таким образом исчезает вероятность ошибки или неверного распознания. Однако, при попытке поиска вакансий по ключевым словам возникают сложности: при поиске по запросу «C#» в выдачу попадают как резюме, где знание данного языка программирования является обязательным условием, так и те, где «знание C# не требуется». Более того, система не распознает такие не все синонимичные понятия и сокращения, например, «MS Office» и «Microsoft office» и «офисный пакет Microsoft».

Если перейти в профиль какой-либо компании, то можно заметить, что большинство из них дублирует вакансии, чтобы привлечь к себе больше внимания и чаще появляться в выдаче. При добавлении такой информации в рекомендательную систему, быстродействие и точность будет снижаться, а значит эффективность самой программы значительно пострадает. Вдобавок ко всему сказанному, нужно отметить, что студента, как правило, интересует не конкретная позиция в конкретной компании, а сфера деятельности, так как вакансии обновляются слишком часто, чтобы в течение всего обучения готовиться на определенное место конкретной компании, так как вакансии быстро закрываются, а требования и условия изменяются.

Из всего вышесказанного в данном разделе можно сделать вывод, о том, что рекрутинговые порталы являются отличным инструментом, однако только для личного пользования или под управлением пользователя, данные на порталах не формализованы: нет единой структуры и правил, в соответствии с которыми информацию можно было бы обрабатывать в автоматическом режиме, как вывод – данные базы не могут служить источниками информации для информационных и рекомендательных систем без предварительной обработки.

Методы монетизации интернет-проектов

Создание и поддержание работы интернет-проектов связано с крупными тратами, так как для функционирования сервиса ему нужны модераторы, специалисты, занимающиеся безопасностью, администраторы, поддержка или аренда серверов, продвижение. Тем не менее большинство интернет проектов не являются убыточными, а наоборот приносят прибыль. Для этого сервис нужно монетизировать, то есть адаптировать для получения доходов от его функционирования. Существует ряд основных методов монетизации интернет-проектов:

  1. Подписка. Оплата услуг в данном случае производится раз в определенный период времени.
    1. Преимущества:
    2. Позволяет разбить большой платеж на малые, больше пользователей могут себе позволить пользование сервисом;
    3. Постоянный источник дохода, так как платят не только новые пользователи, но и старые, упрощает процесс финансового планирования проекта.
    4. Недостатки:
      1. Возможность отписки пользователя;
      2. Если отсутствует бесплатный период, то не все готовы платить сразу.
    1. Расширенная подписка (Freemium). Данная модель подразумевает свободный доступ к сервису с ограниченным функционалом, однако полный функционал доступен только за определенную плату.
      1. Преимущества:
        1. Любой пользователь может позволить себе использование сервиса.
        1. Недостатки:
          1. Малое количество пользователей переходят на платную подписку;
          2. Необходимость сегментировать услуги таким образом, чтобы бесплатное использование было привлекательным, но переход на платную подписку приносил ощутимую пользу клиенту.
      1. Разовая покупка. Модель, применяемая в торговле, когда пользователь оплачивает конкретный товар или разовую услугу.
        1. Преимущества:
          1. Пользователю просто оценить траты на сервис, так как оплата единоразовая;
          2. После того, как пользователь оплатил сервис, он не может отказаться от покупки, то есть сервису не нужно слишком беспокоиться о лояльности пользователей.
          1. Недостатки:
            1. Большой размер разового платежа, невозможность разбить его на малые, что приводит к тому, что меньший процент пользователей может себе позволить использование сервиса;
            2. Низкая мотивация развивать сервис.
        1. Продажа виртуальных товаров. Этот метод широко используется в онлайн-играх и социальных сетях, например, оружие в играх или подарки в социальных сетях.
          1. Преимущества:
            1. Отсутствие трат на производство самого «товара», только на первый экземпляр.
            1. Недостатки:
              1. Данную модель сложно адаптировать для сферы бизнеса, целью которой является реальная прибыль.
          1. Получение комиссии с продаж. Широко применятся сайтами-посредниками, которые получают комиссию за «лиды» (переходы по ссылке) или за продажи перешедшим клиентам.
            1. Преимущества:
              1. Нет нужды в производстве товара или оказании услуги;
              2. Получение прибыли на существующем крупном рынке.
              1. Недостатки:
                1. Высокая конкуренция;
                2. Низкая комиссия.
            1. Контекстная реклама. Добавление рекламных баннеров является самым популярным способом монетизации интернет-проектов, сайт получает деньги за показы рекламы и клики по ней.
              1. Преимущества:
                1. Позволяет сделать сервис бесплатным, так как платят компании, размещающие рекламу;
                1. Недостатки:
                  1. Сложность продаж рекламных мест, высокая конкуренция;
                  2. Сервисы и сайты не всех тематик интересны для рекламодателей;
                  3. Большая часть полезного пространства страницы должна быть выделена под рекламу.
              1. Партнерские программы. Модель, при которой средства идут от заключения партнерских договоров с другими проектами и площадками, а оплата осуществляется за переходы и подписание.
                1. Преимущества:
                  1. Конкуренция ниже, чем на рынке контекстной рекламы;
                  2. Получение прибыли за подписание в независимости от продаж и переходов.
                  1. Недостатки:
                    1. Доход напрямую зависит от аудитории, которая не склонна доверять контекстной рекламе;
                    2. Часть пользователей может перейти к партнеру.
                1. Офферы (плата за сбор информации). Многие сервисы опросов и изучения общественного мнения готовы платить за заполнение анкет и прохождение опросов.
                  1. Преимущества:
                    1. Пользователи остаются на сервисе;
                    1. Недостатки:
                      1. Необходимость мотивировать пользователей на прохождение данных опросов и заполнение анкет;
                  1. Productplacement. При использовании данной модели рекламодатели платят за упоминание бренда в контенте сайта.
                    1. Преимущества:
                      1. Цена размещения намного выше, чем в контекстной рекламе.
                      1. Недостатки:
                        1. Высокая конкуренция;
                        2. Внимание пользователя рассеивается и фокус смещается с самого сервиса.
                    1. Оплата за продвижение. Модель предполагает покупку пользователями высоких позиций в выдаче, реклама пользователей.
                      1. Преимущества:
                        1. Дает пользователям возможность добиться нужных результатов за дополнительную плату;
                        1. Недостатки:
                          1. Изменение правил сортировки;
                          2. «Несправедливость» выдачи снижает мотивацию остальных пользователей.
                      1. Продажа виртуальной валюты. Взимается плата за получение специальных «баллов», которые впоследствии могут быть потрачены внутри сервиса.
                        1. Преимущества:
                          1. Пользователи после покупки валюты не могут вернуть деньги, что означает, что вся сумма будет потрачена на сервисе;
                          2. Сервис получает средства пользователя до приобретения товара или услуги.
                          1. Недостатки:
                            1. У пользователя накапливается остаток неиспользованной валюты, который нельзя потратить в силу его малого размера;
                        1. Добровольные пожертвования. Модель монетизации, при которой ставка делается на пожертвования, которые делают желающие из числа пользователей и гостей сайта(сервиса).
                          1. Преимущества:
                            1. Простой процесс установки на сайт.
                            1. Недостатки:
                              1. Нерегулярность пожертвований, что усложняет процесс финансового планирования;
                              2. Малое количество пожертвований, для достаточного их количества нужна обширная база пользователей.

В реальности же интернет-проекты, как правило, комбинируют модели монетизации, чтобы достичь максимального размера прибыли и охватить как можно более широкую группу пользователей, заказчиков, партнёров и рекламодателей. Очень важно задействовать правильное количество источников дохода, так как при их недостатке проект может быть убыточным и нецелесообразным, а при их переизбытке фокус может быть смещен с оказания качественных услуг на привлечение прибыли, что негативно скажется на лояльности пользователей.

Рекомендательные системы

Понятие рекомендательной системы

Рекомендательная система — программа, созданная для прогнозирования предпочтений пользователя, на основе имеющейся информации о прошлых действиях и особенностях, как данного, так и других пользователей (Ting-Peng Liang, 2006/2007).

Активный пользователь – человек, делающий запрос в рекомендательной системе, лицо, прогнозированием действий которого занимается система.

Подобные системы помогают пользователю в принятии решений, предлагая варианты, которые бы его заинтересовали. Основным отличием от поисковых систем является то, что выдача осуществляется не только на основе поиска по содержанию, но и учитывает поведение пользователей в прошлом. Таким образом, предложения системы более близки пользователю, так как основываются на привычной ему логике, что отменяет необходимость отбирать результаты, как после обычного поиска.

Широкое применение данная технология нашла в потоковых сервисах и Интернет-торговле: практически в каждом музыкальном сервисе (Яндекс.Музыка, Spotify, Last.fm), онлайн-кинотеатре (Netflix, Ivi, Кинопоиск), социальной сети (Вконтакте, Facebook) используются рекомендательные технологии, которые советуют пользователю контент, который ему интересен, что приводит к тому, что она остается на сайте или в приложении. Все крупные интернет-магазины рекомендуют покупателю товары, которые бы могли его заинтересовать, основываясь на том, что он покупал ранее и какие товары просматривал.

Обе стороны получают выгоду от внедрения подобных алгоритмов, так как компания (сайт, сервис) удерживает покупателя (пользователя), толкает его на новые покупки или продление подписки, в то время как пользователю становится проще и удобнее выбирать из многообразия опций.

Очень важным условием корректной работы рекомендательной системы является наличие обратной связи от пользователей. То есть после потребления какого-либо контента или товара пользователь должен оставить свою оценку, чтобы система понимала, стоит ли рекомендовать ему подобные варианты в будущем.

Говоря о потоковых сервисах и онлайн-кинотеатрах, это легко представить, там можно предложить пользователю оценить контент после потребления, учесть количество, частоту и продолжительность прослушивания или просмотра и, основываясь на этих данных, сделать вывод о том, насколько ему интересен данный тип контента. Если же мы рассматриваем интернет-магазин, то ситуация тут намного сложнее, только малая часть пользователей оставляет отзывы о товарах после их использования. Более того, мы не так часто совершаем покупки, как смотрим фильмы или слушаем музыку. Мы, как правило, не покупаем повседневные товары через рекомендательные системы, а совершаем разовые покупки, приобретая товары для длительного использования. Таким образом, очень важно замотивировать пользователя оставлять оценки и отзывы, чтобы лучше понимать образ его мышления, давать более точные рекомендации.

Рекомендательные системы можно отнести к классу самообучающихся систем, так как по мере пополнения базы действий пользователя, алгоритм начинает работать точнее, так как учитывает поведение большего количества людей. С этим же связана одна из самых серьезных проблем при создании и запуске рекомендательной системы – проблема «холодного старта».

Проблемой холодного старта называют начальный этап работы системы, когда она еще не содержит достаточного количества информации, чтобы строить точные прогнозы действий и предпочтений пользователя. Подробнее данный алгоритм будет описан ниже.

Помимо рекомендательных систем в виде надстроек на сайтах существуют рекомендательные сервисы, которые отличаются очень широким профилем. Ярким примером таких сервисов был «imhonet.ru». Он представлял из себя подобие социальной сети, где пользователи могли подобрать себе практически что угодно: музыку, фильмы, телешоу, книги, игры и многое другое. Оставляя свою оценку под тем или иным объектом, пользователи выражали свое мнение о нем, и система предлагала пользователям варианты, которые понравились людям со схожими предпочтениями, то есть данный портал специализировался на данной работе, однако 28 апреля 2017 года проект был закрыт из-за поглощения другой компанией, которая стала владельцем его алгоритмов и технологий.

Можно сказать, что большинство рекомендательных систем основаны на схожих принципах, то есть они сравнивают пользователей или опции между собой, однако в основе дачи рекомендаций лежат разные принципы.

По мнению специалистов(Huang, 2012) признаками качественного рекомендательного сервиса являются:

  • Стабильность работы;
  • Приятный, удобный интерфейс;
  • Эффективность рекомендаций;
  • Удовлетворение полученными данными.

История

История практического использования рекомендательных систем начинается в начале 1990-х годов, когда было впервые введено понятие «коллаборативная фильтрация», метод фильтрации, который и по сей день является самым популярным. В 1992годуДэвидомописалеговстатье «Using collaborative filtering to weave an information tapestry».«Эффективность процесса фильтрации информации повышается, если в него вовлечены люди» - главный тезис, на котором основана данная система. Его разработка, программа «Tapestry», осуществляла фильтрацию входящей почты, что стало своего рода прародителем рекомендательных систем.

После изучения и развития данной технологии ее стали применять в коммерческих целях: интернет-магазины, реклама, социальные сети, на сегодняшний день технологии формирования рекомендаций в той или иной степени используются практически на всех крупных сайтах, порталах, в социальных сетях, онлайн-кинотеатрах, хостингах и т.д.

В образовательной сфере рекомендательные системы используются на сайтах массовых открытых онлайн-курсов, чтобы предлагать студентам курсы на подобие тех, что им понравились, составлять почтовые рассылки.

Что же касается традиционного высшего образования, данные технологии практически не применяются. Единственным подобным сервисом можно считать онлайн-проект, получивший название «Маяк», анонсированный 30 сентября 2014 года компанией «ВТБ» в рамках программы поддержки инициатив в сфере образования, однако по сей день данный продукт не запущен и записи о нем удалены с официального сайта компании. В то же время, данный сервис не является полноценным аналогом системы, которая используется на сайтах открытых университетов (Courseera и Интуит): «Маяк» можно назвать сервисом для профориентации, то есть предназначен он для выпускников, помогая выбрать будущую сферу деятельности, учитывая то, что студент уже умеет делать, он не дает рекомендаций по развитию, а просто соотносит компетенции соискателя и требования работодателя. Принцип работы рекомендательных систем в сфере образования только отдаленно напоминает принцип работы этих систем в других сферах. Применение существующих методов составления рекомендаций, используемых, например, в интернет-магазинах, не видится возможным в образовательной среде ввиду ее специфики. К примеру, выбор курса обязателен и должен быть сделан в строго определенный период времени, такую строгость сложно представить, например, в интернет-магазине.

Классификация и принцип действия методов фильтрации

Рекомендательные системы преимущественно используют два основных принципа формирования рекомендаций: фильтрация на основе содержания и коллаборативная фильтрация. Ниже приведена схема, иллюстрирующая данное разделение:

Рисунок . Классификация рекомендательных систем

Рассмотрим все эти типы более детально, чтобы понять преимущества и недостатки каждого из них.

Первый способ – фильтрация на основе содержания. Например, при подборе книги для пользователя можно проанализировать текст аннотации и составить список ключевых слов. То есть, данный тип заключается в анализе сути и состава каждой из опций, к примеру, в некоторых музыкальных рекомендательных сервисах анализируются слова песен, скорость музыки, даже цвет обложки. На основе данной проверки каждая дорожка, сборник или исполнитель получает определенные метаданные, которые помогают отбирать при помощи фильтров только самые релевантные варианты из всего их многообразия. Книги могут фильтроваться по жанру, автору или издательству.

Второй способ фильтрации – коллаборативная фильтрация. Данный метод заключается в анализе поведения пользователей в прошлом, то есть сделанные в прошлом выборы и их оценка. Содержание вариантов уходит на второй план, система занимается поиском схожих пользователей или опций, чтобы отследить закономерности и предугадать поведение активного пользователя. Подтипы коллаборативной фильтрации отличаются логикой, на основе которой позициям присуждается «рейтинг привлекательности», на основе которого осуществляется ранжирование при выдаче.

Коллаборативная фильтрация на основе моделей представляет из себя комплекс математических формул, описывающих поведение пользователя и способных предсказать вероятность выполнения того или иного действия активным пользователем. Данный метод является достаточно точным, однако требует вычисления различных коэффициентов (вероятности, корреляция и так далее), которые на начальном этапе, когда информации не слишком много достаточно сложно рассчитать. Таким образом данный тип является достаточно точным, но требовательным к вычислительным мощностям и объему и качеству данных.

Тип коллаборативной фильтрации «на основе соседства» опирается на тезис что пользователи, одинаково оценивавшие что-либо в прошлом, склонны схожим образом мыслить и в будущем. Данный тип является, по моему мнению, самым понятным для рядовых пользователей, потому что все знают, что такое «вкус» и предпочтения и что они не так часто меняются.

Алгоритм работы данного метода фильтрации:

  1. Присвоение каждому пользователю значения исходя из похожести с активным пользователем;
  2. Отобрать определенное количество самых похожих пользователей;
  3. Рассчитать вероятность совершения выбора каждой позиции активным пользователем.

Преимуществом данного типа фильтрации является то, что для начала работы необходим минимум информации, однако точность рекомендаций достаточно высока. К недостаткам данного типа можно отнести «проблему переобучения», ситуацию, когда база данных действий пользователей настолько велика, что на обработку запроса уходит слишком много времени, но эта проблема легко решается ограничением количества строк в базе, например, по сроку давности, чтобы обрабатывались только свежие данные, учитывающие последние изменения во внешней среде. В то же время данный тип фильтрации является поверхностным, уступает по точности коллаборативной фильтрации на основе модели, так как не способен обнаружить латентные факторы, влияющие на выбор пользователя.

Традиционные типы фильтрации существуют в большинстве своем только на бумаге в виде теории, на практике в основном используются гибридные типы различного рода, сочетающие в себе преимущества традиционных, чтобы устранить их недостатки. Например, как было описано выше, фильтрация по содержанию отлично подходит для первичной оценки пользователя, когда в системе еще нет информации о его предпочтениях, в то время как коллаборативная фильтрация эффективнее на поздних этапах, так как намного точнее предсказывает предпочтения пользователя.

Получается, что у коллаборативной фильтрации, как целого «семейства» подтипов, есть одна особенность, которая с одной стороны делает его очень эффективным, а с другой создает некоторые сложности для пользователя и разработчика. Данный тип фильтрации невозможно реализовать без обратной связи от пользователей, так как их оценки – основа расчетов рейтинга для выдачи пользователю. При достаточном количестве оценок данный тип фильтрации очень эффективен и точен, однако при недостатке или переизбытке оценок могут возникать проблемы. Следовательно, использование данного метода подразумевает мотивацию пользователя оставлять обратную связь, например, интернет-магазины часто предлагают скидку на следующую покупку, а массовые открытые онлайн-курсы делают почтовую рассылку с просьбой оценить курс, результаты этих оценок в том числе используются и для совершенствования работы рекомендательного сервиса.

Лучшие практики

На сегодняшний день рекомендательные системы широко применяются в Интернет-торговле, покупателям предлагаются товары, которые могли бы быть ему интересны или которые бы дополнили совершенную покупку. Именно поэтому лидерами в разработке алгоритмов являются именно компании, занимающиеся розничной торговлей, так как для них это прямой источник прибыли.

Самыми успешными алгоритмами считается запатентованный алгоритм компанииAmazon. Данный метод называется «Item-to-item». Он оценивает, насколько товары похожи, вычисляя косинус между векторами покупок в матрице покупателей и товаров. Он рассчитывается как разность произведений двух векторов и их норм. Получившийся результат тем выше, чем ближе эти предметы для покупателя. Данный метод является собственностью компании и защищен от копирования. Особенностью данного метода является то, что в вычислениях учитывается только сам факт покупки или выбора, но не учитывается обратная связь, впечатление пользователя от покупки, то есть система порекомендует тот же вариант следующему пользователю, даже если предыдущему он не пришелся по вкусу. Этот принцип используется компанией в расчете на то, что пользователи очень редко оставляют отзывы, к тому же их можно перевести в рейтинг и показывать его рядом с товаром.

Другим эффективным и, как следствие, популярным алгоритмом является коллаборативная оценкаSlopeone для предметов с оценками. Суть метода в следующем: на основе матрицы покупателей и товаров для каждой пары «товар-товар» вычисляется на основе оценок всех пользователей средняя разница оценок, например, «товар 1 в среднем оценивается на 2 балла выше, чем товар 2», после этого значения умножаются на коэффициенты, равные количеству проголосовавших и их сумма делится на сумму коэффициентов. Таким образом, данная система учитывает «похожесть» пользователей, сравнивая то, как они оценивали одни и те же товары в прошлом и на основе уже данных товару оценок предсказывает, придется ли по вкусу данная опция активному пользователю. Данный подход тоже не лишен изъянов: во-первых, небинарное оценивание сложно для пользователя, ему проще поставить «мне нравится» или «мне не нравится», во-вторых, подобные вычисления пагубно сказываются на быстродействии системы, так как перед выдачей результатов она «прогоняет» все имеющиеся результаты через формулу и сравнивает результаты.

Из вышесказанного можно сделать вывод, что даже лучшие из существующих практик не лишены изъянов, что для каждого конкретного случая подходит определенный алгоритм, который не должен быть традиционным, а должен быть разработан специально под нужды конкретного проекта, учитывая его особенности и цели внедрения рекомендательной системы.

Глава 2 Рекомендательные сервисы

Целью данной работы, как было описано во введении является формулировка предпосылок, составление требований и создание прототипа интерфейса программы, предназначенной для формирования рекомендаций по выбору курсов в рамках университета и за его пределами для студентов таким образом, чтобы они получали навыки, необходимые для трудоустройства на интересующие их позиции. Для того, чтобы понять, как данная система должна выглядеть и функционировать, нужно понять кто является целевой аудиторией и проанализировать ее.

Анализ потребителей

Данная система предназначена для трех категорий пользователей:

  • Студентов бакалавриата и магистратуры. Абсолютное большинство пользователей этой категории находятся в возрасте от 18 до 25 лет. Для них правильный выбор курсов важен по следующим причинам:
    1. Список выбранных курсов формирует компетенции, которые пригодятся студентам во время и после трудоустройства;
    2. Углубление знаний, полученных в ходе изучения базовых курсов, необходимое для развития в конкретной области, например, изучение второго языка программирования;
    3. Изучение интересных дисциплин повышает мотивацию студента, посещаемость и, как следствие, мотивацию преподавателя;
    • Компаний-партнеров. В данную категорию попадают компании, имеющие партнёрские договоры с НИУ ВШЭ, обладают хорошей репутацией, являются надежным работодателем. Для данной категории пользователей использование системы дает следующие преимущества:
      1. Канал распространения информации среди студентов, заинтересованных в получении работы или желающих познакомиться с компанией;
      2. База резюме молодых специалистов конкретного вуза с подробной информацией о их обучении, навыках и знаниях;
      • Массовых открытых онлайн-курсов. В эту категорию можно отнести образовательные порталы, МООК и открытые университеты, которые хорошо себя зарекомендовали и имеют партнерский договор с НИУ ВШЭ. Для данной категории пользователей применение сервиса дает:
        1. Площадку для продвижения своих курсов среди студентов с высоким уровнем мотивации;

Характерными отличиями данной категории людей является то, что они, как правило, имеют меньше свободного времени, чем школьники, но больше, чем старшая категория людей. Это связано с тем, что значительная часть студентов частично заняты, проходят стажировки, работают по 20-30 часов в неделю. Второй особенностью данной группы людей является то, что они еще не имеют опыта работы за плечами или имеют небольшой трудовой стаж, следовательно, они в большинстве своем еще не до конца определились с тем, что им интересно, а значит особенно нуждаются в помощи с выбором образовательной траектории. Данная группа людей, традиционно не располагает небольшими средствами, которые могут быть вложены в образование.

Для построения бизнес модели данного сервиса обратимся к методологии CANVAS (модель А. Остервальдера). Данный подход опирается на анализ следующих параметров Александр (Остервальдер, Ив Пинье, «Business Model Generation: A Handbook for Visionaries, Game Changers, and Challengers»).:

  1. Потребительский сегмент -
  2. Ценностные предложения
  3. Каналы сбыта
  4. Взаимоотношения с клиентами
  5. Потоки поступления доходов
  6. Ключевые ресурсы
  7. Ключевые виды деятельности
  8. Ключевые партнеры
  9. Структура издержек

Ключевые партнеры

Ключевые виды деятельности

Ценностные предложения

Взаимоотношения с клиентами

Потребительские сегменты

Ключевые ресурсы

Каналы сбыта

Структура издержек

Потоки поступления доходов

Таблица . МатрицаCANVAS

Анализ потребителей: студенты

Потребительский сегмент

Сервис нацелен на:

  • Студенты бакалавриата и магистратуры НИУ ВШЭ, заинтересованные в построении интересной и полезной образовательной траектории, для повышения собственной мотивации к учебе и получении компетенций, необходимых для дальнейшего трудоустройства и карьерного роста;

Самыми важными клиентами являются:

  • Студенты, определившиеся с направлением будущей работы, с компаниями, трудоустройство в которых представляет для них особый интерес;

Ценностные предложения

Проблемы, решаемые разрабатываемой системой:

  • Подбор курсов в рамках ВУЗа или на сторонних платформах, который бы был максимально интересен для студента, имеющего определенные предпочтения и интересы, стремящегося замотивировать или не потерять существующую мотивацию к учебе;
  • Подбор курсов, которые были бы максимально полезны студенту с точки зрения профессиональной подготовки, уровень которой бы соответствовал требованиям работодателей, интересующих конкретного студента;
  • Подбор мероприятий, посещение и участие в которых положительно скажется на мотивации и осведомленности студента, в ходе которых он получит желаемые навыки и знания.

Ценности предложения:

  • Рекомендации. Программа анализирует предпочтения пользователя на основе его предыдущих действий и оставленной им обратной связи;
  • Информативность. Пользователь сервиса может получить информацию о курсе в сжатом и простом для восприятия виде, понять для каких должностей и компаний прохождение данного курса представляет интерес;
  • Временной фактор. Время, затрачиваемое на поиск и выбор нужного курса очень важно, так как чем больше времени пользователь тратит на эти действия, тем более неочевидным становится процесс выбора и тем больше вероятности, что пользователь сделает случайный выбор, что приведет к неудовлетворению его потребностей.

Услуги, предлагаемые пользователям:

  • Подбор куров для пользователя, построение индивидуальной образовательной траектории с его предпочтений;
  • Фильтрация курсов по степени полезности для трудоустройства, по областям применения, по содержанию;
  • Подбор мероприятий, которые представляют потенциальный интерес для студента, учитывая его интересы и цели.

Каналы сбыта

Повышение осведомленности о сервисе осуществляется через:

  • Почтовую рассылку студентам на корпоративную почту;
  • Представителей сервиса на днях карьеры, проводимых в корпусах университета;
  • Социальные сети университета.

Демонстрация ценности предлагаемого сервиса для клиентов осуществляется через:

  • Уникальность предложения, так как система учитывает предпочтения конкретного пользователя, и интересующих его работодателей

Приобретение услуг производится через:

  • Подписку на сервис. Данная модель оплаты сервиса наиболее предпочтительна, так как позволяет разбить общий платеж на регулярные платежи меньшего объема, что позволяет снизить финансовую нагрузку на пользователя, более того, данная модель предполагает возможность отписки от сервиса, если он не удовлетворил пользователя или необходимость в нем пропала, что вызывает доверие у покупателя, так как является показателем того, что целью разработчиков является качественная работа сервиса, необходимая для сохранения клиента.

Срок поставки ценностного предложения:

  • Оплата подписки на данный сервис может осуществляется помесячно, так как это позволит снизить размер платежа по сравнению с подпиской на год или пожизненной подпиской, так же такая система является более гибкой, так как позволяет отказаться от использования сервиса в более короткий временной промежуток.

Взаимоотношения с клиентами

Отношения с данным сегментом потребителей:

  • Отношения со студентами у сервиса должны быть доверительными вне всяких сомнений, пользователи должны понимать, чем полезно для них использование данной программы, какие преимущества она им дает. Можно утверждать, что как правило по мере обучения внимание студента сдвигается от изучения базового курса к совершенствованию в конкретной области, он определятся с тем, что его интересует и начинает углублять свои знания в данной сфере.

Степень заинтересованности студентов в сервисе:

  • Данный сегмент пользователей имеет высокую мотивацию и способность к обучению в силу возраста;
  • Студенты готовы тратить время и силы на поиск работы и подготовку к трудоустройству, так как от этого зависит их профессиональная карьера и будущая жизнь.

Потоки поступления доходов

Студенты готовы платить за:

  • Качественно подобранный курс из списка курсов университета и за его пределами, который был бы интересен для него и полезен с точки зрения трудоустройства;
  • Качественно подобранные мероприятия, представляющие для студента интерес и полезные для него;
  • Размещение своего резюме на ресурсах, где вероятность найти надежного и интересного работодателя выше.

Что приобретает студент:

  • Достоверная база образовательных курсов, рекомендации по их выбору сформированные исходя из интересов конкретного пользователя, его целей по трудоустройству, рейтинга и содержания курсов.

В течение действия подписки пользователь получает следующие возможности:

  • Подборку курсов и мероприятий, удовлетворяющих его потребностям, в течении определенного периода времени, доступ к сервису;
  • Размещение своего портфолио на ресурсе, куда имеют доступ крупные компании с хорошей репутацией, которые заинтересованы в найме молодых сотрудников, учащихся или окончивших университет.

Ключевые ресурсы

Ресурсы, необходимые для создания ключевых ценностей:

  • База знаний, включающая полный список курсов, представленных в университете и на платформах-партнерах, с их подробным описанием и списком кампаний, которые заинтересованы в их изучении соискателями;
  • Алгоритм формирования рекомендаций, который бы предсказывал предпочтения конкретного пользователя на основе его прошлых действий и действий других студентов;
  • База отзывов пользователей о прохождении курсов, необходимая для работы алгоритма фильтрации и их ранжирования;
  • База мероприятий, проводимых университетом и партнерами, для составления подборок для пользователей.

Каналы распространения:

  • Социальные сети, репутация которых не нуждается в подтверждении;
  • База корпоративных адресов электронной почты студентов для проведения рассылок.

Источники доходов:

  • Подписка на сервис.

Ключевые виды деятельности

Действия, которые необходимо провести для работы сервиса:

  • Разработка эффективного метода фильтрации выдачи;
  • Разработка понятного и привлекательного интерфейса;
  • Разработка методологии сбора информации о пользователе в автоматическом режиме, чтобы снизить вероятность ошибки при вводе или намеренного подлога;
  • Формирование списка партнеров из числа компаний и образовательных платформ;
  • Сбор и формирование в виде базы данных информации о действиях и предпочтениях пользователей;
  • Формирование списка требований работодателей для различных позиций и направлений трудовой деятельности.

Действия, направленные на каналы сбыта:

  • Подготовка плана рекламной компании в социальных сетях университета;
  • Составление текста почтовых рассылок для студентов, который бы детально описывал преимущества сервиса и целесообразность его использования;
  • Подготовка стенда сервиса, предназначенного для продвижения продукта на днях карьеры и прочих мероприятиях университета.

Действия по выстраиванию отношений с клиентами:

  • Формирование базы отзывов пользователей сервиса, которые бы способствовали возникновению доверия студентов к сервису.

Получение и учет доходов:

  • Платная подписка на сервис.

Ключевые партнеры

Партнеры:

  • Крупные компании с хорошей репутацией;
  • Массовые открытые онлайн-курсы;
  • Сторонние образовательные курсы;
  • Сайты-рекрутеры.

Поставщики:

  • Студенты, пользующиеся сервисом;
  • Учебный офис университета;
  • Крупные массовые открытые онлайн-курсы, которые хорошо себя зарекомендовали и являются партнерами ВУЗа;
  • Компании-партнеры с хорошей репутацией;
  • Школы и курсы, занимающиеся дополнительным образованием.

Ресурсы, которые мы получаем от поставщиков:

  • Информация о предпочтениях и поведении студентов при построении образовательной траектории;
  • Списки курсов с их описанием;
  • Требования, предъявляемые к соискателям;
  • Список курсов, аудиторией которых являются студенты.

Структура издержек

Самые дорогие ключевые ресурсы:

  • Создание и наполнение базы знаний, которая бы соответствовала мировым стандартам и была пригодна для качественного и эффективного подбора курсов для конкретного пользователя.

Самые важные затраты:

  • Самое главное это эффективность и работоспособность сайта, что означает, что особое внимание должно уделяться технической стороне вопроса, то есть разработке базы данных и алгоритма фильтрации результатов, которая стоит больших средств.

Самые дорогие действия:

  • Техническая разработка, отвечающая за качество и стабильную работу сервиса;
  • Детальный бизнес-анализ проекта, гарантирующий, что создание данного сервиса целесообразно и не будет убыточным.

Анализ потребителей: компании

Потребительский сегмент

Сервис нацелен на:

  • Компании, заинтересованные в найме молодых специалистов, студентов и выпускников ВУЗов-лидеров, обладающих должным уровнем подготовки, не нуждающиеся в долгом обучении, заинтересованные в работе в данной отрасли или данной компании.

Самыми важными клиентами из вышеперечисленных для нас являются:

  • Компании-партнеры НИУ ВШЭ, имеющие наиболее полное представление об учебном процессе в университете, о качестве образования, имеющие представительство в стенах ВУЗа, которые наиболее заинтересованы в найме студентов и выпускников, имеют хорошую репутацию.

Ценностные предложения

Какие проблемы призвана решить разрабатываемая система:

  • Подготовка кадров, обладающих определенным списком знаний и умений, которые наиболее полным образом удовлетворяют требованиям компании к соискателю на определенную должность;
  • Подбор кадров, из числа молодых специалистов, обладающих конкретными характеристиками и профессиональными навыками, требующих минимальное обучение.

Ценности предложения:

  • Фильтрация. Программа позволяет отфильтровать студентов по определенным умениям и навыкам, по успеваемости, пройденным курсам и прочим правилам;
  • Информативность. Пользователь сервиса может получить информацию о курсах в сжатом и простом для восприятия виде, сформировать из них список тех, прохождение которых рекомендуется соискателю;
  • Временной фактор. База данных, к которой работодатель имеет доступ содержит только студентов, что сокращает время поиска кандидатов для компаний, желающих нанять молодых специалистов, что очень важно, так как компании желают как можно скорее найти сотрудника на вакантное место, не поступившись качеством;
  • Достоверность. Работодатель видит достоверную информацию о студенте, его успеваемости по ключевым для позиции дисциплинам, курсах, пройденных им на сторонних платформах, собранную в одном месте и защищенную от редактирования, что делает практически невозможным ее подлог при попытке трудоустройства;
  • Эффективность. Компания может сделать предложение или пригласить на мероприятие сразу группу студентов, отфильтровав их по определенному признаку.

Услуги, предлагаемые пользователям:

  • Подбор кандидатов на определенную вакансию, основываясь на требованиях, предъявляемых к соискателю;
  • Фильтрация студентов по различным признакам, их группировка для рассылки приглашений на собеседования или анонсов мероприятий;
  • Подбор мероприятий, которые представляют потенциальный интерес для студента, учитывая его интересы и цели;
  • Проверка предоставляемой студентом информации.

Каналы сбыта

Повышение осведомленности о сервисе осуществляется через:

  • Почтовую рассылку менеджерам компаний;
  • Распространение информации о сервисе на базовых кафедрах;
  • Социальные сети университета.

Демонстрация ценности предлагаемого сервиса для клиентов осуществляется через:

  • Достоверная база данных студентов, которые находятся в поиске работы, которая может быть отфильтрована по интересующим признакам;
  • Инструмент для проведения различных кампаний и информирования студентов.

Приобретение услуг производится через:

  • Подписку на сервис. Данная модель оплаты сервиса имеет ряд преимуществ, например, регулярные платежи от компаний, возможность отписки и корректировки тарифов, гарантии качества сервиса, так как только эффективность и польза от использования сервиса может удержать пользователя

Срок поставки ценностного предложения:

  • Помесячная оплата сервиса или разовый доступ к базе студентов-соискателей.

Взаимоотношения с клиентами

Отношения с данным сегментом потребителей:

  • Для поддержания доверительных отношений с компаниями-партнерами нужно уделять должное внимание контролю качества данных и правильности работы сервиса, пользователь отплатит лояльностью и продлит подписку, если использование данного сервиса будет приносить ему квалифицированные кадры, а использование сервиса будет простым и эффективным

Степень заинтересованности компаний в сервисе:

  • Компании постоянно находятся в поиске молодых кадров, которые можно «вырастить» под себя, обучив отличного сотрудника;
  • Из-за того, что нанятые сотрудники, как правило, не полностью соответствуют требованиям вакансии, компании вынуждены проводить обучение, которое требует времени, сил и средств.

Потоки поступления доходов

Компании готовы платить за:

  • Достоверную базу студентов, ищущих работу, с которыми можно связаться;
  • Инструмент для проведения информирования студентов о мероприятиях и новостях и прочих кампаний;
  • Возможность помочь студенту подготовиться к найму в процессе получения образования, чтобы максимально сократить издержки на подготовку сотрудника в стенах компании;
  • Размещение объявления о вакансии на ресурсе, где собрана целевая аудитория.

Что приобретает компания:

  • Достоверная база студентов, заинтересованных в получении работы, которую можно фильтровать исходя из требований конкретной вакансии;
  • Канал информирования студентов;
  • Инструмент воздействия на процесс подготовки будущих сотрудников.

В течение действия подписки пользователь получает следующие возможности:

  • Доступ к базе данных студентов и выпускников, ищущих работу;
  • Доступ к инструментарию для проведения рассылок и кампаний.

Ключевые ресурсы

Ресурсы, необходимые для создания ключевых ценностей:

  • База знаний, включающая полный список курсов, представленных в университете и на платформах-партнерах, с их подробным описанием; для составления списков рекомендуемых курсов для позиций в компании;
  • Инструментарий для фильтрации списка соискателей по различным признакам;
  • База почтовых адресов студентов для проведения рассылок.

Каналы распространения:

  • Записи на официальных страницах компаний в социальных сетях;
  • Почтовые рассылки менеджменту компаний.

Источники доходов:

  • Подписка на сервис;
  • Реклама компаний-партнеров;
  • База данных студентов, которая представляет интерес для работодателей и сайтов-рекрутеров.

Ключевые виды деятельности

Действия, которые необходимо провести для работы сервиса:

  • Разработка инструментария для создания фильтров компетенций для определённых должностей;
  • Разработка понятного и привлекательного интерфейса;
  • Разработка методологии контроля качества информации и ее защиты от редактирования;
  • Формирование списка студентов, ищущих работу, которая может быть передана третьим лицам;
  • Разработка инструментария для проведения фильтрации списка студентов.

Действия, направленные на каналы сбыта:

  • Подготовка PR-компании в сообществах университета в социальных сетях;
  • Составление текста почтовых рассылок для менеджмента компаний, чтобы привлечь внимание к сервису.

Действия по выстраиванию отношений с клиентами:

  • Формирование базы отзывов клиентов-компаний сервиса, чтобы повысить доверие к сервису.

Получение и учет доходов:

  • Платная подписка на сервис;
  • Получение комиссии за найденных в компании сотрудников;

Ключевые партнеры

Партнеры:

  • Студенты, предоставляющие свои данные;
  • Массовые открытые онлайн-курсы;
  • Учреждения дополнительного образования.

Поставщики:

  • Студенты, пользующиеся сервисом;
  • Учебный офис университета;
  • Крупные массовые открытые онлайн-курсы, которые хорошо себя зарекомендовали и являются партнерами ВУЗа;
  • Школы и курсы, занимающиеся дополнительным образованием.

Ресурсы, которые мы получаем от поставщиков:

  • Информация о пройденных курсах и успеваемости;
  • Списки курсов с их описанием;
  • Список сторонних курсов, аудиторией которых являются студенты.

Структура издержек

Самые дорогие ключевые ресурсы:

  • Создание и наполнение базы знаний, которая бы соответствовала мировым стандартам и была пригодна для качественного и эффективного подбора кадров с возможностью последующей фильтрации.

Самые важные затраты:

  • Разработка алгоритмов фильтрации и пользовательского интерфейса, что необходим, чтобы заполучить и сохранить лояльность этого сегмента потребителей, необходимо, чтобы сервис работал стабильно и выполнял свои функции.

Самые дорогие действия:

  • Техническая разработка, отвечающая за качество и стабильную работу сервиса;
  • Детальный бизнес-анализ проекта, гарантирующий, что создание данного сервиса целесообразно и не будет убыточным;
  • Рекламная кампания.

Анализ потребителей: массовые открытые онлайн-курсы и учреждения дополнительного образования

Потребительский сегмент

Сервис нацелен на:

  • Массовые открытые онлайн-курсы, заинтересованные в привлечении студентов и выпускников ВУЗов на свои программы на платной и бесплатной основе.

Самыми важными клиентами из вышеперечисленных для нас являются:

  • Платформы-партнеры НИУ ВШЭ, имеющие соглашение с университетом, имеющие хорошую репутацию и должный уровень обучения.

Ценностные предложения

Какие проблемы призвана решить разрабатываемая система:

  • Привлечение студентов и выпускников к обучению на данных платформах путем дачи рекомендаций курсов.

Ценности предложения:

  • Доверие. Платформы, представленные на подобном портале, проходят проверку, следственно их присутствие на страницах сервиса вызывает доверие со стороны студентов;
  • Огласка. Все пользователи сервиса узнают обо всех платформах-партнерах;
  • Временной фактор. Так как система помогает студенту подобрать нужный курс, он тратит на это меньше времени, что снижает вероятность того, что студент не дойдет до этапа выбора курса или бросит его не завершив;
  • Продвижение. Размещение на сервисе, аудитория которого совпадает с целевой аудиторией МООК, способствует эффективной рекламе платформы.

Услуги, предлагаемые пользователям:

  • Размещение курсов образовательной платформы в сервисе и показ данного перечня пользователям-студентам и пользователям-компаниям.

Каналы сбыта

Повышение осведомленности о сервисе осуществляется через:

  • Почтовую рассылку менеджерам МООК;
  • Социальные сети МООК.

Демонстрация ценности предлагаемого сервиса для клиентов осуществляется через:

  • Целевая аудитория МООК, собранная в одном сервисе, который так же имеет инструментарий для проведения информационных и рекламных кампаний.

Приобретение услуг производится через:

  • Подписку на сервис, которая дает доступ к функциям добавления курсов, редактирования информации о них, инструментарию для информирования студентов и прочим. Данный метод оплаты особенно популярен сегодня из-за того, что позволяет разбить большой единый платеж на серию небольших.

Срок поставки ценностного предложения:

  • Помесячная оплата сервиса.

Взаимоотношения с клиентами

Отношения с данным сегментом потребителей:

  • Для поддержания доверительных отношений с платформами-партнерами нужно уделять должное внимание продвижению курсов, представленных на платформах, среди студентов университета.

Степень заинтересованности компаний в сервисе:

  • Массовые открытые онлайн-курсы непрерывно ищут новых клиентов, так как количество студентов не ограничено размерами аудиторий, не требуется постоянное участие преподавателя в образовательном процессе.

Потоки поступления доходов

Компании готовы платить за:

  • Информацию о студентах, заинтересованных в прохождении дополнительных курсов;
  • Инструмент для проведения информирования студентов о предложениях и новостях платформы;
  • Продвижение курсов платформы среди целевой аудитории, которая склонна доверять.

Что приобретает платформа:

  • Достоверная база студентов, заинтересованных в прохождении курсов в дополнение к тем, которую представлены в университете;
  • Канал информирования студентов;
  • Инструмент для привлечения новых клиентов на платформу.

В течение действия подписки пользователь получает следующие возможности:

  • Доступ к базе данных студентов и выпускников, желающих пройти курсы;
  • Доступ к инструментарию для проведения рассылок и кампаний.

Ключевые ресурсы

Ресурсы, необходимые для создания ключевых ценностей:

  • База знаний, включающая полный список студентов и выпускников;
  • Инструментарий для фильтрации списка студентов по различным признакам;
  • База почтовых адресов студентов для проведения рассылок;
  • База требований работодателей, которая бы служила источником информации для построения рекомендаций для студентов.

Каналы распространения:

  • Записи на официальных страницах платформ в социальных сетях;
  • Почтовые рассылки менеджменту платформы.

Источники доходов:

  • Подписка на сервис;
  • Комиссия за проданные курсы;
  • Контекстная и нативная реклама платформ-партнеров;

Ключевые виды деятельности

Действия, которые необходимо провести для работы сервиса:

  • Разработка инструментария для фильтрации студентов по различным признакам;
  • Разработка понятного, удобного и привлекательного интерфейса;
  • Разработка методологии контроля качества информации и ее защиты от редактирования.
  • Создание базы всех онлайн-курсов, которая бы содержала всю необходимую информацию о каждом курсе и метаданные, необходимые для сравнения и фильтрации результатов.

Действия, направленные на каналы сбыта:

  • Подготовка PR-компании в сообществах университета в социальных сетях;
  • Составление текста почтовых рассылок для менеджмента платформ, чтобы привлечь внимание к сервису.

Действия по выстраиванию отношений с клиентами:

  • Количественный показатель переходов на платформу с разрабатываемого сервиса будет самым точным образом отражать эффективность сервиса.

Получение и учет доходов:

  • Платная подписка на сервис;
  • Получение комиссии за проданные курсы;

Ключевые партнеры

Партнеры:

  • Студенты, предоставляющие свои данные;
  • Компании-партнеры;
  • Учреждения дополнительного образования.

Поставщики:

  • Студенты, пользующиеся сервисом;
  • Учебный офис университета;
  • HR-менеджеры компаний-партнёров;
  • Школы и курсы, занимающиеся дополнительным образованием.

Ресурсы, которые мы получаем от поставщиков:

  • Информация о пройденных курсах и успеваемости;
  • Списки базовых курсов с их описанием;
  • Список требований, предъявляемых кандидату на определенную позицию.

Структура издержек

Самые дорогие ключевые ресурсы:

  • Создание и наполнение достоверной базы курсов, отвечающей мировым стандартам и которая могла бы быть использована для качественного и эффективного подбора кадров с возможностью последующей фильтрации.

Самые важные затраты:

  • Разработка алгоритмов контроля качества данных и пользовательского интерфейса, так как данные компоненты необходимы, чтобы заполучить и сохранить лояльность этого студентов, что позволит заинтересовать платформы в продолжении сотрудничества.

Самые дорогие действия:

  • Техническая разработка, необходимая для качественной и бесперебойной работы сервиса;
  • Детальный бизнес-анализ проекта, который позволит убедиться, что создание данного сервиса целесообразно и прибыльно;
  • Рекламная кампания.

Алгоритм

Тип фильтрации

В первой главе данной работы я рассматривал классификацию методов фильтрации, используемых в рекомендательных системах, останавливаясь на преимуществах и недостатках каждого. Как уже было отмечено, эффективность разных типов фильтрации варьируется в зависимости от условий, в которых находится система.

На начальных этапах, сразу после запуска системы, когда в базе еще не содержится достаточного объема информации о поведении пользователей, более эффективным будет использование фильтрации по содержимому, то есть, имея достаточное количество информации о том, что любит конкретный пользователь, система может подобрать для него соответствующий вариант.

По мере увеличения количества информации о пользовательском поведении более эффективной становится коллаборативная фильтрация, так как она учитывает поведение всех пользователей, и на его основе прогнозирует, что буде интересно активному пользователю. Комбинирование методов фильтрации является приемом, который во много раз повышает эффективность рекомендательного сервиса (Orad, 1998).

Так как выбор учебной дисциплины - это ответственный шаг, где нельзя всецело полагаться только на мнение окружающих, а стоит учитывать и содержание курса, было решено использовать гибридный метод фильтрации, сочетающий в себе как фильтрация по содержимому, так и оба типа коллаборативной фильтрации.

Таким образом, этот вид фильтрации более предпочтителен для использования в учебной среде, так как учитывает общее впечатление от дисциплины у студента, так как неотъемлемой частью данного метода является оценивание и обратная связь от пользователя.

Ранжирование

Как описывалось выше, процесс фильтрации и функционал будет меняться в зависимости от того, на каком этапе находится проект, то есть каким объемом информации о поведении пользователей располагает система.

На начальном этапе система будет иметь в основном информационные функции, так как с самого запуска будет иметь достоверную информацию о курсах и требованиях компаний-работодателей. Для составления рекомендаций будет использоваться фильтрация по содержанию, по окончании курса студенту предлагается оценить курс в бинарной системе «мне нравится-мне не нравится» при этом он должен учитывать, как впечатление о курсе, так и полезность курса в его понимании, после чего полученная обратная связь добавляется в базу данных.

По мере наполнения базы действий пользователя, к фильтрации по содержанию добавляется коллаборативная фильтрация, чтобы сделать алгоритм эффективнее и точнее.

При запросе к рекомендательному сервису запускается алгоритм формирования рекомендаций, который всегда имеет схожий принцип действия:

  1. Система определяет, какие пользователи похожи на активного пользователя. Для этого для каждого пользователя проверяем количество совпадающих оценок с активным пользователем назначаем «коэффициент похожести», то есть вероятность, с которой его предпочтения совпадут с предпочтениями активного пользователя относительно интересующей нас дисциплины;
  2. Система ранжирует пользователей по «коэффициенту похожести» от большего к меньшему, чтобы наверху списка оказались те пользователи, чьи предпочтения максимально похожи на предпочтения активного пользователя;
  3. Выбираются первыеn результатов из списка (n может варьироваться в зависимости от того, насколько велик список альтернатив, так как чем больше значениеn, тем выше точность оценки);
  4. После того, как сформирован пул похожих пользователей, происходит фильтрация всех позиций по параметрам, которые выбрал пользователь, среди них могут быть теги, фильтры, созданные компаниями, площадки, на которых находятся курсы, или стоимость курса.
  5. Система строит матрицу студентов и курсов для данного пула пользователей, которые максимально похожи на активного;
  6. Для каждой из альтернатив система рассчитывает предполагаемую оценку активного пользователя, исходя из оценок пользователей со схожими предпочтениями;
  7. Система ранжирует все альтернативы по получившемуся значению от большего к меньшему, то есть по оценки, которую должен дать активный пользователь;
  8. Выдача формируется из опций с самой высокой предполагаемой оценкой, то есть на первых местах оказываются альтернативы, которые активный пользователь предпочтет с наибольшей вероятностью;

Таким образом, данный алгоритм учитывает все аспекты: мнение студентов, интересы пользователя, требования работодателя. Это все может быть реализовано, так как выбор достаточно узок, студенту не предлагается более 10 альтернатив, как правило их около 4, в первых строках выдачи указываются самые интересные для студента варианты, однако никакие из них не убираются из выдачи совсем, что дает возможность сделать правильный выбор, получив максимум информации. В выдаче студент видит самые интересные дисциплины по мнению студентов, прошедших их, видит их оценку, понимает, какие из них будут цениться при приеме на работу и прохождение каких курсов будет представлять интерес для него.

Реализация

Принцип

Разрабатываемый сервис рекомендаций, как и любая система должен иметь определенную структуру, список элементов, таких как вход, понятийное ядро, сценарий (результат работы системы) и выход (См. Рисунок 2).

Рисунок . Структура рекомендательного сервиса

Рассмотрим каждый элемент подробнее:

  • Вход. Данный элемент включает в себя все данные которые получает система, среди них: личная информация пользователя, параметры сделанного запроса и прочая информация;
  • Понятийное ядро системы. Элемент системы, отвечающий за логическую обработку поступившей информации, после получения запроса он предлагает необходимые решения;
  • Сценарий. После того, как полученный запрос обработан, есть вероятность возникновения множества решений вместо единственного, в таком случае система должна выбрать более предпочтительный сценарий, а ходе которого будут получены максимальные результаты и пользователь будет удовлетворен работой системы;
  • Выход. Элемент, отвечающий за выдачу информации пользователю в удобном для восприятия виде, где все данный формализованы и систематизированы.

Необходимые данные и проблемы, связанные с их сбором

Персональные данные студента

Персональные данные студента необходимы сервису для заполнения профиля пользователя, определение его интересов для проведения фильтрации по содержимому на первых этапах. Данная информация особа важна, так как используется для связи с пользователем, защищена законом «О персональных данных».

Сложность в том, что, дабы не нарушать закон, для использования сервиса студент должен подписать соответствующий документ, который бы разрешал обработку, хранение и передачу его персональных данных для предоставления услуг по подбору курсов, мероприятий и поиска работы. Поскольку достоверность данных является приоритетом разрабатываемой системы, количество данных, вводимых вручную должно быть минимизирована, так как это снижает вероятность ошибки или намеренного подлога информации.

Для того, чтобы формировать профиль пользователя автоматически, можно использовать загрузку данных их существующей информационной системы университета. При регистрации пользователь указывает свою корпоративную почту, по ней осуществляется поиск профиль в системеLMS, откуда впоследствии загружается вся необходимая информация о студенте, образовательной программе, курсе и группе, список базовых дисциплин и так далее. Дополнительные сведения о предпочтениях, опыте, школьном образовании и прочем пользователь вводит вручную.

Такая схема сбора информации будет являться гарантом того, что база студентов достоверна, в ней нет случайных людей, а информация о пользователях максимально точная и актуальная.

Информация о базовых курсах

Помимо загрузки персональных данных из системы LMS, как было описано выше, данная система располагает информацией о том, какие базовые курсы входят в данную образовательную программу, какие курсы по выбору взял студент. Автоматическая загрузка этих данных делает невозможной ситуацию, когда студент забыл указать, что выбирал ту или иную дисциплину, что помогает сформировать верную базу действий пользователя, чтобы после получения обратной связи понять, какие предпочтения имеет данный студент и рекомендовать ему заведомо интересные курсы.

Однако, по какому признаку можно фильтровать учебные дисциплины? Они имеют не такой уж большой список метаданных, которые могли бы служить признаками для фильтрации в выдаче, каждому курсу соответствует кафедра и преподаватель, однако этого недостаточно для полноценной фильтрации, поэтому решением будет добавление пула тегов к каждой дисциплине, которые бы описывали суть предмета и помогали системе в фильтрации. Данные теги могут быль добавлены сотрудниками учебного офиса или пользователями, добавив в конечный вариант самые популярные теги.

Информация о курсах на сторонних площадках

Помимо курсов, предлагаемых университетом, разрабатываемая система занимается подбором курсов, которые представлены на образовательных платформах и открытых университетах. В продвижении курсов заинтересованы сами платформы, поэтому в их интересах предоставить максимально полную информацию о курсе, указав теги, которые будут использоваться для сортировки и подбора курсов системой.

Список требований работодателя

При построении своей образовательной траектории студент может ориентироваться на существующие в данный момент вакансии, однако данный подход имеет ряд недостатков.

Во-первых, как было упомянуто в описании процесса найма сотрудника, компании чаще указывают в объявлениях о вакансиях не полный перечень требований, а минимальный их набор, это делается, чтобы привлечь большее внимание к вакансии, и чтобы сделать поправку на текущую ситуацию на рынке труда, где может не хватать квалифицированных кадров.

Во-вторых, информация о вакансиях быстро устаревает, особенно в высокотехнологичных сферах, что делает неэффективной ориентацию на конкретную должность в течение нескольких лет, ведь к тому времени вакансия уже давно будет закрыта, что сделает набор имеющихся компетенций не столь полезным.

Для того, чтобы при подборе курсов учитывать конъюнктуру рынка труда, при составлении рекомендаций необходимо брать в расчет, какие требования работодатель предъявляет к кандидату, однако, как говорилось ранее, выстраивать образовательную траекторию с учетом требований в конкретной должности неэффективно, так как вакансии, как правило, закрываются значительно быстрее. Таким образом, сбор информации с сайтов-рекрутеров не является верным решением, так как данные там не отличаются высоким качеством, быстро устаревают.

По перечисленным причинам было решено предлагать компаниям составлять фильтры из набора требований, которые предъявляются к целому направлению, например, «разработчик Яндекс». Таким образом набор требований будет достаточно универсален, чтобы в случае закрытия вакансии обратиться в аналогичную компанию или сменить направление на смежное. Заменив конкретные вакансии на направления, мы добьемся значительного численного снижения данных смарт-фильтров, что облегчит работу в сервисе для компаний. Как следствие, компании смогут создавать фильтры вручную, максимально точно и детально указывая все требования и рекомендации. Это повысит качество фильтров. А значит и эффективность работы сервиса, что положительно скажется на лояльности всех категорий пользователей.

Информация о действиях студентов и обратная связь от них

Для работы коллаборативной части алгоритма фильтрации система должна располагать информацией о действиях пользователей в прошлом. Выбор того или иного курса система регистрирует автоматически через системуLMS и API образовательных платформ. Обратная связь получается в виде бинарной оценки и комментария (по желанию), которые будут видны остальным пользователям. Оценка заносится в базу напротив соответствующего курса и учитывается при следующем запуске алгоритма фильтрации. Коллаборативная фильтрация очень хорошо себя показывает, когда в системе имеется достаточное количество данных, однако на начальных этапах данный тип фильтрации практически бесполезен. Эта ситуация называется «проблемой холодного старта».

Решение проблемы «холодного старта»

На этапе запуска сервиса база действий пользователей будет совершенно пустой, что сделает невозможным использование коллаборативной фильтрации. Для решения данной проблемы будет применен метод контентной фильтрации, однако для его использования нужно собрать информацию о каждом пользователе, чтобы на ее основе фильтровать выдачу. Для получения необходимой информации могут быть использованы следующие методы:

  • Анкетирование. Пользователю предлагается ответить на ряд простых вопросов о его предпочтениях и умениях, на основе полученных ответов заполняется информация о пользователе, пригодная для осуществления фильтрования;
  • Заполнение действующими студентами. Когда бы не состоялся запуск системы, в университете будут обучаться студенты всех курсов, предложив им заполнить обратную связь о курсах, которые они проходили последними, мы получим выборку оценок каждой дисциплины достаточную для применения алгоритмов коллаборативной фильтрации.

Кроме данных о пользователе нужно собрать данные об опциях, чтобы осуществлять фильтрацию на их основе. Для образовательных курсов подойдет анализ описания курса на предмет ключевых слов и добавление тегов, описывающих основные особенности дисциплины.

Процесс сбора информации

По данным причинам было решено не собирать требования конкретных вакансий, а создавать фильтры требований к областям, например, «аналитик по мнению Яндекс» или «программист SAP». Таким образом данное решение будет носить достаточно общий характер, выполнение данных требований «откроет двери» во многие компании, но в то же время они будут составлены авторитетными организациями, которые диктуют правила рынка в нашей стране.

При создании такого фильтра менеджер указывает компетенции, которые необходимы, чтобы претендовать на должность из этой сферы в данной компании. Полученные данные сравниваются с тегами, которые содержатся в описании дисциплины, и система понимает, насколько данная дисциплина пригодится при трудоустройстве.

Благодаря данному решению каждой дисциплине будет соответствовать одно или несколько профессиональных направлений, видимых пользователю, по которым он сможет фильтровать выдачу.

Для того, чтобы менеджерам компаний не нужно было писать код и запросы к базе данных, в сервисе будет создан конструктор фильтров, который поможет выбрать все, что нужно без особых сложностей, назвать фильтр и загрузить в систему для дальнейшего использования.

Необходимо минимизировать поток информации от пользователя, чтобы сократить возможность получения недостоверной или искаженной информации. Также сокращение требуемой информации от потребителя сможет снизить отток пользователей сервиса, ввиду минимального ввода информации о себе и не затруднительности данной процедуры.

Как связать с существующей системой

На данный момент в университете используется система LMS (Learning Management System), которая имеет доступ к большей части необходимой информации: персональные данные студентов, информация о проходимых в университете курсах, информация о самих курсах университета, успеваемости студентов и прочее. Подключаясь к базеLMS с использованием идентификатора студента, сервис избавляется от необходимости в хранении персональных данных пользователей, на что нужно дополнительное разрешение, так как данные этого типа защищаются законом о персональных данных (Федеральный закон "О персональных данных" от 27.07.2006 N 152-ФЗ).

Данные о требованиях работодателя представители компании вносят в систему вручную, используя инструментарий сервиса, который позволяет это сделать, не вникая в технические подробности и функционирование сервиса.

Данные о курсах, представленных на обучающих платформах-партнерах могут быть внесены как вручную, так и загружены с сайта МООК, чтобы ускорить и упростить процесс.

Требования к интерфейсу

Кроме того, что сервис должен быть качественным и эффективным, он должен быть удобным, интуитивным и привлекательным. За это отвечает визуальный интерфейс сервиса, то есть то, как он выглядит для пользователей различных сегментов.

Для того, чтобы сервисом было приятно и легко пользоваться, при разработке нужно учитывать следующие аспекты:

  • Интерфейс не должен быть перегружен элементами, информация должна быть равномерно распределена по страницам;
  • Сервис должен иметь сдержанную цветовую гамму, минимальное количество рекламных баннеров и картинок;
  • Сервис должен быть интуитивно понятным, пользователь не должен тратить большое количество времени на обучение использованию сервиса.

Монетизация

Из описанных в первой главе методов монетизации интернет-проектов далеко не все подходят для применения в разрабатываемом сервисе. Рассмотрим каждый из них:

  • Подписка

Как видно из построенной бизнес-модели, основными источниками прибыли является продажа подписки на сервис компаниям и массовым открытым онлайн-курсам. Делать большую ставку на студентов я бы не стал, так как, во-первых, студенты являются не очень платежеспособным сегментом потребителей, во-вторых, именно база студентов является основным активом сервиса, так как за нее и готовы платить компании и платформы, значит, мы должны создать все условия для ее наполнения, в то время как плата «отпугнет» большое количество пользователей из данного сегмента;

  • Расширенная подписка (Freemium)

данная модель монетизации, по моему мнению, неприменима в данном проекте так как предоставляемые услуги взаимосвязаны и их невозможно сегментировать для разных пользователей;

  • Разовая покупка

В случае сервиса в сфере образования монетизация посредством единовременной покупки уступает модели доступа к сервису по подписке, так как пользователи-студенты по большей части ограничены в средствах и из-за нерегулярности платежей финансовое планирование сервиса будет усложнено;

  • Продажа виртуальных товаров.

Модель неприменима, так как виртуальные товары не интересуют пользователей разрабатываемого сервиса;

  • Получение комиссии с продаж.

Взимание комиссии с курсов-партнеров за проданные курсы будет достаточно эффективным способом заработка для образовательного сервиса, так как его пользователи – целевая аудитория образовательных платформ;

  • Контекстная реклама.

Перспективным источником прибыли баннерная реклама, то есть которая демонстрируется на страницах сервиса. Очень важно не добавлять слишком много рекламы, чтобы не терять доверие пользователей, не создавалось впечатления, что главная задача сервиса – продать рекламное место, а не оказать качественные услуги;

  • Партнерские программы.

Помимо получения комиссии с платформ-партнеров за проданные курсы, заключение партнёрского договора тоже может быть платным, что будет хорошей мотивацией для платформ продвигать только качественные курсы и активно заниматься продвижением и информированием, развивать сервис;

  • Офферы (плата за сбор информации).

Дополнительным источником прибыли может быть продажа базы пользователей или ее части третьим лицам, которые заинтересованы в каналах распространения какой-либо информации среди пользователей. Не стоит забывать, что подобная политика ударит по имиджу сервиса, пошатнет доверие пользователей, что пагубно скажется на всем сервисе и его качестве. Более «этичным» способом будет предложение студентам заполнить анкету или пройти опрос для продолжения работы с сервисом;

  • Productplacement.

Нативная реклама в сервисе может принести дополнительные средства в проект, так как пользователи сервиса – конкретный сегмент рынка, студенты, а значит размещение рекламы будет стоить дороже, чем на многопрофильных площадках;

  • Оплата за продвижение.

Данная модель неприменима в сервисе, так как цель сервиса – формирование рекомендаций, исходя из полезности и предпочтений пользователя, а не на платной основе;

  • Продажа виртуальной валюты.

Использование виртуально валюты нецелесообразно в рамках образовательного сервиса.

  • Добровольные пожертвования.

Модель добровольной помощи проекту в виде пожертвований легко встраивается в любой проект, однако из-за того, что пользователи студенты не слишком платежеспособны, а остальные сегменты потребителей пользуется сервисом на платной основе, пожертвований ждать не стоит.

Важно понимать, что политика получения доходов должна быть выстроена таким образом, чтобы она была достаточно прозрачной, чтобы не вызвать недоверие у пользователей-студентом, не снижать их мотивацию пользоваться сервисом. Таким образом, нужно понимать, что продажа подписки компаниям и платформам должна являться приоритетом для сервиса. И проведенного анализа можно сделать следующий вывод, что для того, чтобы проект генерировал прибыль или хотя бы не был убыточным, нужно использовать основные методы монетизации:

  • Подписка;
  • Получение комиссии с продаж;
  • Контекстная реклама;
  • Партнерские программы.

В качестве дополнительных источников средств, по моему мнению, можно использовать:

  • Офферы;
  • Productplacement.

В графическом виде модель взаимодействия агентов можно представить в следующем виде:

Рисунок . Модель взаимодействия агентов

Комбинирование вышеперечисленных источников прибыли позволит не привлекать дополнительных средств на содержание сервиса, более того, при правильной настройке данных компонентов сервис может приносить своим владельцам прибыль.

Глава 3

Для того, чтобы понять, как должен выглядеть разрабатываемый сервис, нужно было заняться прототипированием, создать образцы интерфейса, который бы мог лечь в основу сервиса в будущем. Большая часть страниц сервиса является доступной для всех сегментов пользователе, однако личный кабинет и главная страница сервиса меняются в зависимости от того, кем является конкретный пользователь и какой функционал его интересует. Рассматривать интерфейс мы будем на примере интерфейса пользователя студента, а в разделе об интерфейсе компаний и платформ укажем на отличие функционала для данных сегментов.

Пользовательский интерфейс: студенты

На рисунке 4 представлен внешний вид раздела, который рассказывает о требованиях и рекомендациях курсов для людей, желающих заниматься разработкой в компании Яндекс. Верхняя часть страницы представляет собой список разделов сервиса, среди которых главная страница, «Курсы», «МООК», «Компании», «Новости» и «Помощь». Все данные разделы за исключением первого являются в первую очередь информационными, работа с сервисом осуществляется на главной странице сервиса, где пользователь оставляет обратную связь о курсах и разделе «Курсы», где пользователь может получить рекомендации по выбору курса на базе предпочтений и дополнительных условий, в том числе на рынке труда.

Рисунок . Страница описания направления от компании

Рисунок 5 показывает, как могла бы выглядеть главная страница сервиса, предназначенная для информирования пользователя о взятых курсах, о процессе их прохождения, тут же можно оставить обратную связь о пройденных курсах, бинарно оценив их и оставив комментарий во всплывающем окне. На верхней панели помимо ранее перечисленных элементов находится имя пользователя, при нажатии на которое мы переходим в профиль пользователя, где можем поменять настройки.

Рисунок . Главная страница пользователя-студента

На рисунке 6 можно наблюдать внешний вид профиля компании при просмотре пользователем. Помимо описания самой компании здесь представлен перечень направлений, открытых работодателем, куда он ищет молодых сотрудников, кликнув на которые, можно получить более подробную информацию, о требуемых компетенциях и рекомендованных курсах.

Рисунок . Раздел "о компании"

Рисунок 7 демонстрирует внешний вид страницы, предназначенной для осуществления поиска курсов по пользовательским требованиям. Помимо поиска по тематикам, который реализован через левую панель, присутствует система фильтров, способных сделать поиск более точным и гибким. При выборе режима поиска по пользовательским требованиям пользователю предлагается выбрать такие параметры как платформа, язык, сложность и длительность из вложенных списков, указать, интересуют ли его платные курсы и добавить теги, описывающие терминами то, что он ищет (поиск по ключевым словам). После нажатия кнопки «Поиск» информация обрабатывается на основании алгоритмов фильтрации и ранжируется при выдаче.

Рисунок . Страница поиска курсов по пользовательским требованиям

При поиске курсов по рекомендациям работодателя, который демонстрируется на рисунке 8, для запуска поиска пользователь должен выбрать компанию и(или) сферу желаемой должности, а система предложит ему курсы, прохождение которых, по мнению потенциального работодателя, может быть полезна. При выдаче система ранжирует курсы по степень их потенциальной привлекательности, и показывает рейтинг дисциплины, то есть какой процент прошедших курс пользователей остался доволен. Таким образом пользователь не вынужден всецело полагаться на систему, а может сделать осознанный выбор, получив максимум информации.

Рисунок . Раздел поиска курсов по требованиям компаний

Страница МООК выглядит, как представлено на рисунке 9. Здесь имеется название курса, его краткое описание, учебный план, где можно посмотреть полную информацию по каждому курсу более детально, кликнув на значок информации напротив курса. Ниже учебного плана идет перечисление сфер и компаний, посчитавших данный курс полезным. Если курс интересен пользователю, то он может нажать на кнопку «записаться», после чего он будет перенаправлен на сайт МООК по специальной ссылке, которая позволяет отслеживать количество переходов с сервиса, что необходимо за получения комиссии с продаж курсов.

Рисунок . Интерфейс раздела "МООК"

Пользовательский интерфейс: компании

В случае, когда мы используем сервис от лица компании, на главной странице сервиса, как видно на рисунке 10, располагается информация об имеющихся фильтрах, о которых можно посмотреть информацию или изменить их настройку. В скрытом списке «неактивные» доступны старые фильтры, которые не используются в данный момент, однако могут быть восстановлены в один клик.

Рисунок . Главная страница пользователя-компании

При сознании нового или настройке существующего фильтра пользователь-компания попадает в конструктор, представленный на рисунке 11. Пользователю предлагается заполнить описание курса, чтобы студент мог сформировать представление о том, что из себя представляет дисциплина, ориентировочный уровень заработной платы. Следующий этап – добавление рекомендованных курсов, которые, по мнению компании, принесут пользу в процессе подготовки к работе в конкретной сфере. Нажатие на кнопку «+» открывает окно поиска курсов, которые можно добавить к фильтру. Заключительный этап в процессе подготовки фильтра компании – добавление тегов, которые отображают сущность этой сферы деятельности, данная информация будет использована для поиска по ключевым словам и для работы алгоритма фильтрации по содержанию. После нажатия кнопки «сохранить» данный фильтр будет добавлен в систему и станет доступен пользователям.

Для компании мотивацией совершать все эти действия служит желание найти хорошо подготовленного сотрудника, чтобы потратить минимум времени на обучение. В то же время процесс достаточно прост, чтобы не занимать большого количества времени у пользователя.

Рисунок . Создание фильтра пользователем-компанией

На рисунке 12 показана страница сервиса, позволяющая компаниям находить нужных студентов и связываться с ними. Для осуществления поиска пользователь-компания может использовать фильтрацию студентов по различным параметрам, например, по образовательной программе, курсу, по списку пройденных дисциплин, по опыту работы.

Данная функция может быть использована как для адресной рассылки (приглашение на собеседование, стажировку), так и для массовой рассылки, так как можно выбирать сразу группу пользователей.

Таким образом, разрабатываемый сервис является отличным каналом для связи и распространения информации, за это отвечает функция обмена сообщениями, которую можно вызвать, нажав на значок письма напротив конкретного студента, или отправить сообщение сразу группе пользователей, по нажатию на аналогичный значок в шапке выдачи, предварительно отметив интересующих пользователей (галочка в левой части строки студента).

Важно понимать, что так как общение между пользователями будет проходить внутри сервиса, отпадает необходимость показывать адрес электронной почты, что делает невозможными кражу базы студентов или спам-рассылку.

Пользовательский интерфейс: МООК

Интерфейс при работе с сервисом как пользователь-образовательная платформа практически не отличается от того, что видят студенты и представители компаний. Единственное разница в том, что в отличии от компании на главной странице у МООК отображаются не фильтры, а курсы, которые занесены в систему. Следовательно, и страница добавления курсов отличается от пользовательского интерфейса для добавления фильтров (см. Рисунок 13). После добавления названия курса МООК предлагается заполнить следующие поля: описание курса, категория, в которой он будет отображаться при поиске студентами и компаниями, ссылка на страницу курса на сайте самой платформы, тэги, которые будут служить ключевыми словами при осуществлении поиска, и длительность курса. Заносить достоверные данные в интересах представителей платформы, так как разрабатываемый сервис является перспективным источником клиентов, а, следовательно, и прибыли.

Рисунок . Добавление курса пользователем-МООК

Заключение

В ходе проделанной работы была проделана следующая работа: изучены теоретические аспекты смежных областей, проанализированы российские и зарубежные научные статьи на смежные тематики. В силу своей сложности и новизны данная тема недостаточно активно изучается.

После изучения теоретической базы был составлен бизнес-план проекта, который помог понять, как организовать данный проект, на кого он должен быть направлен, откуда можно извлекать прибыль, какие каналы можно использовать и какие издержки будет иметь проект.

Для того, чтобы проект не был убыточным и даже мог приносить доход, были рассмотрены существующие модели монетизации интернет-проектов, выбраны те, которые могут быть использованы в разрабатываемом сервисе в силу специфики оказываемых услуг и особенностей различных сегментов потребителей.

Важнейшим аспектом при создании рекомендательного сервиса является выбор и разработка метода фильтрации. В своей работе я рассмотрел классические методы фильтрации и их разновидности. Для каждого из них я обозначил сильные и слабые стороны, обозначил ситуации, когда каждый из них наиболее эффективен в использовании. В итоге сформулировал принцип выбора метода фильтрации в зависимости от внешних факторов, количества информации, которой располагает система и желаний пользователя.

После определения алгоритма обработки информации был проведен анализ необходимой для функционирования сервиса информации и источников, откуда она может быть получена.

Заключительным этапом проделанной работы было прототипирование пользовательского интерфейса, с учетом требований к разрабатываемой системе, особенностям пользователей и их потребностей.

Данный проект является весьма перспективным как с точки зрения полезности, которую он несет, так и с коммерческой стороны, так как может монетизироваться и приносить прибыль.

Кроме того, данная концепция имеет большие перспективы развития, так как может масштабироваться на другие ВУЗы, и образовательные учреждения, однако, в таком случае будет необходима доработка системы, чтобы учитывались особенности учебного процесса в заведениях отличных от НИУ ВШЭ.

Список использованной литературы

Наем персонала: методы и технологии. (2017).Директор по персоналу.

Ожегов, С. (2015).Толковый словарь русского языка.

Большая советская энциклопедия. (1969-1978). Советская энциклопедия.

Huang, H.-R. C.-G. (2012). Navigating in the Digital Era: Digital Literacy: Socio-Cultural and Educational Aspects.Journal of Educational Technology & Society , 15.

McAuley, B. S. (2010).The MOOC Model for Digital Practice.

Orad, D. a. (1998).Implicit feedback for recommender systems. AAAI Technical Report WS-98-08: Workshop on Recommender Systems. . Menlo Park, CA : American Association for Artificial Intelligence.

Ting-Peng Liang, H.-J. L.-C. (2006/2007).ournal of Management Information Systems, 23.

Wang, F.-H. (2008).Journal of Educational Technology & Society, 11.

Разработка методологии создания и прототипа рекомендательной системы на http://mirrorref.ru


Похожие рефераты, которые будут Вам интерестны.

1. Методы и средства разработки прототипа веб-системы

2. Разработка алгоритма определения методологии управления проектами для ИТ-компаний

3. Разработка методологии исследования, направленного на выявление восприятия различного контента представителями поколения Y

4. Разработка программы для создания кроссвордов

5. Разработка меню, для создания успешного кафе

6. Методика построения диаграммы потоков данных функциональной модели автоматизированной системы управления в методологии DFD

7. Методика построения функциональной модели предметной области для проектирования автоматизированной системы управления в методологии IDEF0

8. Разработка бизнес-проекта создания АИС Магазин интернет-услуг

9. Разработка девелоперского проекта на примере создания логистического центра дочерней организации ОАО Газпром

10. ПРАКТИЧЕСКОЕ ПРИМЕНЕНИЕ ТЕОРИИ ЛЕКСИЧЕСКОГО ПРОТОТИПА