{"blocks":[{"type":"expertLegacy","data":{"id":"1024"}},{"type":"paragraph","data":{"text":"Привет! Я — Роман Куцев, дата-инженер в компании Neatsy. Мы с командой разрабатываем приложение, с помощью которого можно с первого раза заказать в интернете комфортную обувь. Наша идея — помочь людям подбирать обувь онлайн, а интернет-магазинам не терять деньги на возвратах. Чтобы осуществить задумку, нам нужно было обучить нейросеть — собрать и разметить 50 тысяч фотографий ног разного размера. Расскажу, как мы решали задачу, какие набили шишки и почему краудсорсинг — удобный инструмент для сбора данных."}},{"type":"header2","data":{"level":2,"text":"Обратиться к 200 знакомым, собрать 3000 фотографий и попасть в два чёрных списка"}},{"type":"paragraph","data":{"text":"Итак, перед нами задача: собрать датасет из 50 тысяч фотографий, чтобы научить алгоритм автоматически строить 3D-модель стопы и определять её размер даже при плохом освещении и на пёстрой плитке. Мы составили требования к съёмке с учётом разных условий:"}},{"type":"list","data":{"items":["освещение: искусственное, дневной свет, сумерки;","фон: паркет, линолеум, пушистый ковер, разноцветная плитка — годилось всё;","цвета кожи: от светлых до тёмных;","ракурсы ног: под разными углами, сверху, снизу, сбоку."],"style":"ordered"}},{"type":"paragraph","data":{"text":"Мне уже приходилось искать исполнителей для разметки данных: до Neatsy я работал в Prisma, где тоже нужно было собирать данные для обучения нейронных сетей. В Prisma нам повезло: наш разработчик Вячеслав Тарасов параллельно преподавал в Воронежском государственном университете, и у него был доступ к большому числу студентов. Не знаю, как он их мотивировал — хорошей оценкой или «автоматом», но студенты присылали нужные фото и видео, и мы успешно собирали данные."}},{"type":"embed","data":{"link":"https://tproger.ru/experts/data-science-practice"}},{"type":"paragraph","data":{"text":"У команды Neatsy не было доступа к студентам, поэтому мы нашли другой способ: публиковали сториз, звонили и писали всем друзьям, знакомым и родным, безбожно отвлекали их от дел, просили заснять свои ноги и отправить нам. Мы были как секта сетевого маркетинга. Двое наших знакомых даже добавили нас в чёрный список."}},{"type":"image","data":{"file":{"id":131813,"url":"https://media.tproger.ru/uploads/2020/07/2-1.png"},"alt":"","title":"","caption":"","stretched":false,"withBackground":false,"withBorder":false,"width":828,"height":1133,"optimizedFile":{"original":"https://media.tproger.ru/uploads/2020/07/2-1.png","alt":"Как за 75 долларов собрать датасет из 50 тысяч изображений: опыт стартапа Neatsy 1","dimensions":{"width":828,"height":1133},"additionalSizes":{"srcSet":[{"url":"https://tproger.ru/signed_image/BrPyxRfVwBUm4NsC1cCig2pntzFf-jfH54o1SjXChok/rs:fill:766:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAyMC8wNy8yLTEucG5n","dpr":1,"width":766},{"url":"https://tproger.ru/signed_image/1uKhgps7FVv7eZusKDDHLutXsj_5zreae2al7wAbB84/rs:fill:1532:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAyMC8wNy8yLTEucG5n","dpr":1,"width":1532},{"url":"https://tproger.ru/signed_image/L1dRwjrqVlzKeBx679G7NX4IDp_548Ehsend6KWvA5k/rs:fill:686:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAyMC8wNy8yLTEucG5n","dpr":1,"width":686},{"url":"https://tproger.ru/signed_image/UeL1dv_Qwj_nmDfb5rYExAaS0lIQ5qcIDP61u39XKWY/rs:fill:1372:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAyMC8wNy8yLTEucG5n","dpr":1,"width":1372},{"url":"https://tproger.ru/signed_image/_AYQcERjL9UkZ4JSRd7hA1uu6RiQA6G8eS4Mfp7NGWE/rs:fill:636:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAyMC8wNy8yLTEucG5n","dpr":1,"width":636},{"url":"https://tproger.ru/signed_image/q4bzskHmx58UHHdW52BsJ5_PjFi0Yy2nxT5lfwPcVKk/rs:fill:1272:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAyMC8wNy8yLTEucG5n","dpr":1,"width":1272},{"url":"https://tproger.ru/signed_image/7x9KNmzqDPuvrqTOLjnjvqI0RZ94yKLHsPy1occfDgI/rs:fill:466:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAyMC8wNy8yLTEucG5n","dpr":1,"width":466},{"url":"https://tproger.ru/signed_image/hl5P5NutB4HH5IFfPEIu5MrEzBMEWtWEYsRdjTKCOAY/rs:fill:932:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAyMC8wNy8yLTEucG5n","dpr":1,"width":932}],"sizes":[{"media":"(min-width: 1441px)","size":"766px"},{"media":"(min-width: 1281px)","size":"686px"},{"media":"(min-width: 1281px)","size":"766px"},{"media":"(min-width: 961px)","size":"766px"},{"media":"(min-width: 671px)","size":"636px"},{"media":"(min-width: 500px)","size":"466px"}]}}}},{"type":"paragraph","data":{"text":"Такие дела"}},{"type":"header2","data":{"level":2,"text":"Осознать, что всё не так просто"}},{"type":"paragraph","data":{"text":"Увы, стратегия оказалась проигрышной. Во-первых, на наш клич отозвались всего 200 человек, потому что круг знакомых всё-таки ограничен."}},{"type":"paragraph","data":{"text":"Во-вторых, такой метод отнимал слишком много сил и времени. Нужно написать каждому и рассказать, что сделать; дождаться данных, скачать и перепроверить. На одного человека уходило в среднем 20 минут. Потребовалось бы около восьми рабочих дней, чтобы собрать 200 видео. А нам нужно было больше, чем 200 видео."}},{"type":"paragraph","data":{"text":"Поясню, почему мы собирали видео, а не фото. Если обучать нейронную сеть на тех же данных, которые ожидаются в реальной жизни, качество её работы будет выше. А мы планировали обучить нейронную сеть сегментировать ноги по видеопотоку. Поэтому кадры, нарезанные из видео, были предпочтительнее фотографий."}},{"type":"paragraph","data":{"text":"В общей сложности мы собрали около 3000 изображений. В принципе, для проверки гипотез и создания MVP этого достаточно. Но чтобы создать продукт, который работает в любом месте и на каждом человеке, данных надо намного больше."}},{"type":"header2","data":{"level":2,"text":"Встать на нужные рельсы"}},{"type":"paragraph","data":{"text":"Набив шишки, мы решили пойти по другому пути и отдать задачу в Яндекс.Толоку. Вот несколько моментов, которые были нам на руку:"}},{"type":"list","data":{"items":["Передача авторских прав. Юристы в международных компаниях часто беспокоятся о чистоте и прозрачности передачи прав на результаты интеллектуальной деятельности. В Толоке всё было просто и однозначно: результаты разметки принадлежат заказчику. Словом, можно спать спокойно.","Гибкое масштабирование. Нам понравилось, что Толока работает как биржа: мы дали задание — его выполняют, не дали — исполнители занимаются другими заданиями и ничего от нас не ждут. Это намного удобнее, чем нанимать штат разметчиков, которым не будет хватать нагрузки: рано или поздно актуальные задачи могут закончиться.","Огромное количество исполнителей. На краудсорсинговых платформах ежедневно работают десятки тысяч исполнителей. Мы подсчитали, что с нашей задачей, которую штат разметчиков будет делать три недели, разметчики на краудсорсинговой платформе справятся за день.","Стоимость разметки. Забегу вперёд и скажу, что мы получили огромный объём фотографий за пять дней, потратив на это меньше 100 долларов."],"style":"unordered"}},{"type":"paragraph","data":{"text":"Теперь к делу — расскажу, как мы собирали данные и что из этого вышло."}},{"type":"header2","data":{"level":2,"text":"Грамотно настроить пайплайн"}},{"type":"paragraph","data":{"text":"Основное правило краудсорсинга гласит: большую задачу нужно декомпозировать — то есть разбить на множество маленьких подзадач. Мы прикинули, из каких этапов будет состоять проект, и разделили его на четыре части."}},{"type":"header3","data":{"level":3,"text":"1. Сбор видео"}},{"type":"paragraph","data":{"text":"Первым делом мы попросили толокеров снять ноги на видео и показали видеопример: лучше один раз увидеть, чем сто раз услышать. В первой инструкции мы клали на пол любую пластиковую карточку, предполагая, что карточка в кадре поможет улучшить точность построения 3D-скана. Но прироста в точности это не дало, так что мы отмели эту идею, и финальные условия стали такими:"}},{"type":"list","data":{"items":["продолжительность записи — 20–60 секунд (нам нужно около 30 секунд видео от одного толокера, чтобы на выходе получить 30–50 различных кадров от каждого);","камеру навести на ноги без носков и обуви, с подвёрнутыми до икр штанами;","помещение не должно быть слишком тёмным;","видео снять с самых разных ракурсов: мы просили менять высоту, и угол съёмки."],"style":"unordered"}},{"type":"paragraph","data":{"text":"Вот как выглядела инструкция:"}},{"type":"image","data":{"file":{"id":131814,"url":"https://media.tproger.ru/uploads/2020/07/3-1.png"},"alt":"","title":"","caption":"","stretched":false,"withBackground":false,"withBorder":false,"width":2970,"height":1816,"optimizedFile":{"original":"https://media.tproger.ru/uploads/2020/07/3-1.png","alt":"Как за 75 долларов собрать датасет из 50 тысяч изображений: опыт стартапа Neatsy 2","dimensions":{"width":2970,"height":1816},"additionalSizes":{"srcSet":[{"url":"https://tproger.ru/signed_image/TXAXycT63zokMAE6c9cdL0J-ISt_zEuJu2WXH0AXjSg/rs:fill:766:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAyMC8wNy8zLTEucG5n","dpr":1,"width":766},{"url":"https://tproger.ru/signed_image/DGUFOHmaECxNnkStUJ7wj6myWSuYQbKiR2FNsiDwtno/rs:fill:1532:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAyMC8wNy8zLTEucG5n","dpr":1,"width":1532},{"url":"https://tproger.ru/signed_image/RjFWzOF-yLZ-4aiRNcHFVO4CoCSCnsUEkUTd5F7aiK8/rs:fill:686:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAyMC8wNy8zLTEucG5n","dpr":1,"width":686},{"url":"https://tproger.ru/signed_image/ofwxsC_mmdWffsxf0F_j_fIPmd2MbvXOHJ8UKyl6x8M/rs:fill:1372:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAyMC8wNy8zLTEucG5n","dpr":1,"width":1372},{"url":"https://tproger.ru/signed_image/lecs5siM9afKh7kibLOM6PzYImac0BrDBVI_pLGnmjQ/rs:fill:636:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAyMC8wNy8zLTEucG5n","dpr":1,"width":636},{"url":"https://tproger.ru/signed_image/hX4NckNpjBV-AB9P7ztEqLBJy_Su5bkQ3TkBtceQrLY/rs:fill:1272:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAyMC8wNy8zLTEucG5n","dpr":1,"width":1272},{"url":"https://tproger.ru/signed_image/Y-PTDrp_XmpC55alESLc2Hg-Gk0Yt1O0j1DA3ocyVO4/rs:fill:466:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAyMC8wNy8zLTEucG5n","dpr":1,"width":466},{"url":"https://tproger.ru/signed_image/cb3pRay0u4rnb9y-YQECILxWMowByAVm2P_s2NmPAWY/rs:fill:932:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAyMC8wNy8zLTEucG5n","dpr":1,"width":932}],"sizes":[{"media":"(min-width: 1441px)","size":"766px"},{"media":"(min-width: 1281px)","size":"686px"},{"media":"(min-width: 1281px)","size":"766px"},{"media":"(min-width: 961px)","size":"766px"},{"media":"(min-width: 671px)","size":"636px"},{"media":"(min-width: 500px)","size":"466px"}]}}}},{"type":"paragraph","data":{"text":"Она неспроста такая подробная: чем чётче вы всё распишете, тем точнее разметчики выполнят задание и тем умнее будет нейросеть."}},{"type":"paragraph","data":{"text":"За 2 дня и 17 часов мы собрали 2472 ролика. Чтобы видеозаписи были как можно разнообразнее, мы установили ограничение на количество заданий. Один толокер мог прислать нам только одно видео."}},{"type":"paragraph","data":{"text":"Задание было с отложенной приёмкой: мы отправляли полученные видео на проверку следующей группе исполнителей и спрашивали, верно ли записан ролик. После этого первой группе исполнителей выплачивали деньги — только тем, чьи ролики были приняты."}},{"type":"header3","data":{"level":3,"text":"2. Проверка видео и фото"}},{"type":"paragraph","data":{"text":"На этом этапе исполнители определяли, соответствует ли техническому заданию присланный первыми толокерами контент. Но сначала пользователи проходили обучение, и доступ открывался только тем, кто хорошо выполнял задания. Работало это так: мы просили проверить 30 видео (для каждого из которых знали правильный ответ) и считали число правильных ответов у исполнителя. Если точность была больше 85%, мы допускали его к основному заданию."}},{"type":"paragraph","data":{"text":"Вот как выглядела инструкция на этом этапе:"}},{"type":"image","data":{"file":{"id":131815,"url":"https://media.tproger.ru/uploads/2020/07/4-1.png"},"alt":"","title":"","caption":"","stretched":false,"withBackground":false,"withBorder":false,"width":3486,"height":1850,"optimizedFile":{"original":"https://media.tproger.ru/uploads/2020/07/4-1.png","alt":"Как за 75 долларов собрать датасет из 50 тысяч изображений: опыт стартапа Neatsy 3","dimensions":{"width":3486,"height":1850},"additionalSizes":{"srcSet":[{"url":"https://tproger.ru/signed_image/Py7HrAAawnbW_lf9Zw-SS6r-RMcbhIGi153dIHoFDKM/rs:fill:766:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAyMC8wNy80LTEucG5n","dpr":1,"width":766},{"url":"https://tproger.ru/signed_image/Mw0xgzjK53TcRzzfHqJyTQPv3bvtMRgKxq7N0zzKO40/rs:fill:1532:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAyMC8wNy80LTEucG5n","dpr":1,"width":1532},{"url":"https://tproger.ru/signed_image/6B8RwrC_wtManncVxt6KGSkNcr0g7M10Sx8mXAsg1-8/rs:fill:686:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAyMC8wNy80LTEucG5n","dpr":1,"width":686},{"url":"https://tproger.ru/signed_image/-YXBoaHtLMefE4DC28ov4HSte3Cv-KjNZvBlN8rzvqg/rs:fill:1372:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAyMC8wNy80LTEucG5n","dpr":1,"width":1372},{"url":"https://tproger.ru/signed_image/VKre-3_iZETPH2qvcQps5o1iLcq1MMuse642lONyAis/rs:fill:636:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAyMC8wNy80LTEucG5n","dpr":1,"width":636},{"url":"https://tproger.ru/signed_image/2a69LeFXsSWgDX5ildYTniY9kVxfcxZeLO8x6mCwGjc/rs:fill:1272:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAyMC8wNy80LTEucG5n","dpr":1,"width":1272},{"url":"https://tproger.ru/signed_image/t5BJN0de1hUzgI5nfUBz5l5BzcJOOjrlE1ygRiZVVe4/rs:fill:466:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAyMC8wNy80LTEucG5n","dpr":1,"width":466},{"url":"https://tproger.ru/signed_image/Y32fsJ4pIIjAIROTtJiwFzidSyEkjXfOKpwMoMkYLW4/rs:fill:932:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAyMC8wNy80LTEucG5n","dpr":1,"width":932}],"sizes":[{"media":"(min-width: 1441px)","size":"766px"},{"media":"(min-width: 1281px)","size":"686px"},{"media":"(min-width: 1281px)","size":"766px"},{"media":"(min-width: 961px)","size":"766px"},{"media":"(min-width: 671px)","size":"636px"},{"media":"(min-width: 500px)","size":"466px"}]}}}},{"type":"paragraph","data":{"text":"Обратите внимание на первый абзац: очень важно говорить исполнителям, для чего они работают. Понимая, что их труд уходит не впустую, они активнее включаются и качественнее выполняют задания"}},{"type":"paragraph","data":{"text":"Также было важно настроить правила контроля качества: от них зависит и качество датасета, и мотивация исполнителей — можно выявлять и блокировать тех, кто плохо выполняет задания, и поощрять тех, кто исправно работает. Чтобы поощрять хороших исполнителей, мы платили больше денег за задания, которые были выполнены более качественно, а чтобы отсеивать недобросовестных исполнителей, использовали ханипоты и блокировку за слишком быстрые ответы. Ханипоты — это «проверочные» задания, для которых мы заранее знаем правильный ответ. Внешне они не отличаются от остальных, но по ответам на эти задания можно определить, насколько хорошо толокер выполняет задачу."}},{"type":"paragraph","data":{"text":"Из 2472 видео мы приняли 1507. За каждый принятый ролик мы заплатили 0,025 доллара, ещё 7,41 — за проверку всех роликов. То есть всего к этому этапу проекта мы потратили 45 долларов. На мой взгляд, это очень круто."}},{"type":"header3","data":{"level":3,"text":"3. Раскадровка видео"}},{"type":"paragraph","data":{"text":"Следующий этап — разбивка видео на кадры. Мы сделали это автоматически, не привлекая толокеров. Я использовал программу FFmpeg, которая очень быстро работает с картинками и видео. В процессе участвовал каждый десятый кадр, и из 1507 видео мы собрали 156 576 кадров, получив в три раза больше изображений, чем планировали."}},{"type":"embed","data":{"link":"https://tproger.ru/translations/parking-searching"}},{"type":"paragraph","data":{"text":"Но для качественного обучения нейронной сети нужен вариативный датасет: в нём должны быть непохожие друг на друга картинки. В нашем случае в датасете получилось много кадров-близнецов, оставив которые, мы не добились бы повышения качества, а только потратили много денег на разметку. Поэтому я удалил их автоматически, используя библиотеку ImageHash. Для каждого изображения я получил хэш — набор чисел, который характеризует изображение. Алгоритм составления хэша так устроен, что похожие картинки будут иметь похожий хэш, а разные — разный. Кластеризовав хэши, я нашёл все похожие изображения и оставил только по одному кадру в каждом кластере. На следующем этапе толокеры проверяли 57 тысяч кадров."}},{"type":"header3","data":{"level":3,"text":"4. Проверка кадров — финальный этап в Толоке"}},{"type":"paragraph","data":{"text":"Завершающий этап работы в Толоке — проверка кадров. Иногда во время съёмки может дёрнуться рука, и на видео появляются размытые кадры. Мы удалили размытые и отобрали чёткие изображения, на которых видна стопа человека. Вот как это выглядело:"}},{"type":"image","data":{"file":{"id":131816,"url":"https://media.tproger.ru/uploads/2020/07/5.png"},"alt":"","title":"","caption":"","stretched":false,"withBackground":false,"withBorder":false,"width":3588,"height":1854,"optimizedFile":{"original":"https://media.tproger.ru/uploads/2020/07/5.png","alt":"Как за 75 долларов собрать датасет из 50 тысяч изображений: опыт стартапа Neatsy 4","dimensions":{"width":3588,"height":1854},"additionalSizes":{"srcSet":[{"url":"https://tproger.ru/signed_image/wSCKYyQaUa88GCr_w2HMIZeJvBlEPONy3Mf6Perc65s/rs:fill:766:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAyMC8wNy81LnBuZw=","dpr":1,"width":766},{"url":"https://tproger.ru/signed_image/LgFpbP1jUrn2PLQu8VI1Fny-jWfpOkJQydvDnmUCcQg/rs:fill:1532:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAyMC8wNy81LnBuZw=","dpr":1,"width":1532},{"url":"https://tproger.ru/signed_image/6Y7_WgAsyxJL5E6C14cmDF7MRtu_5THmRpscKzmImcQ/rs:fill:686:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAyMC8wNy81LnBuZw=","dpr":1,"width":686},{"url":"https://tproger.ru/signed_image/wCtHI5nqFbGcudiiObl66PtGRpIItgZpB7QRQGWV-ng/rs:fill:1372:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAyMC8wNy81LnBuZw=","dpr":1,"width":1372},{"url":"https://tproger.ru/signed_image/0oibo0qziqJNjHxNP0290LTm9a__UV4TqEYm6IsF_h0/rs:fill:636:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAyMC8wNy81LnBuZw=","dpr":1,"width":636},{"url":"https://tproger.ru/signed_image/KKUgl7Ef9sVqKYZ0SnBz3KAoNDvdHJ3Ws4yDfCngXFQ/rs:fill:1272:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAyMC8wNy81LnBuZw=","dpr":1,"width":1272},{"url":"https://tproger.ru/signed_image/JNoRSxIWGbawVHpxBly333gYGPF_0ZPISPmTiLQTTok/rs:fill:466:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAyMC8wNy81LnBuZw=","dpr":1,"width":466},{"url":"https://tproger.ru/signed_image/TuKIjQMPhvhIfGZErSwrUQbqp0SYQGV0gztAxRfaVfE/rs:fill:932:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAyMC8wNy81LnBuZw=","dpr":1,"width":932}],"sizes":[{"media":"(min-width: 1441px)","size":"766px"},{"media":"(min-width: 1281px)","size":"686px"},{"media":"(min-width: 1281px)","size":"766px"},{"media":"(min-width: 961px)","size":"766px"},{"media":"(min-width: 671px)","size":"636px"},{"media":"(min-width: 500px)","size":"466px"}]}}}},{"type":"paragraph","data":{"text":"Весь процесс в Толоке я менеджерил в одиночку. Вначале проект довольно трудно настроить (написать интерфейс, инструкции, выстроить контроль качества), но, когда он налажен, всё идёт само по себе и не требует постоянного внимания."}},{"type":"header3","data":{"level":3,"text":"5. Бонус: досбор контента на Amazon Mechanical Turk"}},{"type":"paragraph","data":{"text":"На тот момент в Толоке работали в основном жители России и стран СНГ, и мы получали фото ног с достаточно светлой кожей. Нам же хотелось, чтобы нейронная сеть могла работать в том числе и на более смуглой коже. Сейчас такой проблемы уже нет — в Толоке появились исполнители из Индии и Африки, но тогда нам пришлось собирать другие оттенки через платформу Amazon Mechanical Turk."}},{"type":"paragraph","data":{"text":"Мы создали одно задание, в котором просили людей заснять свои ноги, загрузить видео на файлообменник и прислать нам ссылку. Задание было с отложенной приёмкой, проверкой занимался наш стажёр."}},{"type":"paragraph","data":{"text":"Если сравнивать цены, стоимость одного видео в Amazon была выше, чем в Толоке — 0,1 доллара. Что касается качества — некоторые исполнители, как и в Толоке, присылали неправильные видео, но мы их отклоняли и не платили за эти задания."}},{"type":"header2","data":{"level":2,"text":"Оглянуться и сделать выводы"}},{"type":"paragraph","data":{"text":"Вот наши результаты:"}},{"type":"list","data":{"items":["собрали: 156 576 кадров;","применили в деле: 50 994 изображения;","потратили времени: 5 дней;","потратили денег: 75 долларов."],"style":"unordered"}},{"type":"paragraph","data":{"text":"Мы боялись, что в Толоке никто не захочет выполнять нашу странную задачу. Но к счастью, этот страх не оправдался, и мы получили то, за чем пришли. Мы переживали, что толокеры будут халтурить и неправильно выполнять задания, но с помощью инструментов контроля качества нам удалось сделать так, чтобы люди присылали то, что нужно. И самое главное — мы собрали необходимые данные меньше чем за неделю!"}},{"type":"paragraph","data":{"text":"А на днях мы наконец закончили разработку и выпустили приложение в свет. Но это уже совсем другая история."}}]}

Ошибка в настройках сайта