2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




Начать новую тему Ответить на тему
 
 Деление на train, val и test выборки
Сообщение15.02.2023, 23:28 


29/12/09
366
У меня 16 размеченных фотографий на которых я детектирую дефекты. Я хочу обучить модель Yolo и проверить ее точность на валидационной и тестовой выборке. 16 фотографий явно мало для обучения, поэтому можно использовать различные виды аугментации и получить много фотографий для обучения модели, для определенности будем считать что из 16 фотографий различными видами аугментации (поворт, отражение, сдвиг, изменение яркости и контрастности и т.п.) можно получить, ну условимся для простоты 1000 фотографий. И вот теперь вопрос, насколько правильно использовать из этой 1000 фотографий на валидацию и тест например по 150 - валидация и 150 на тест. Ведь это более менее те же фотки, но видоизмененные.
Наверное, правильнее сделать отбор до аугментации из 16 фотографий, например взять 10 на обучение и аугментировать их для обучения, оставшиеся 3 на валидацию и 3 на тест, но на трех фотографиях проверять точность, маловато будет. Остается аугментировать эти 3 фотографии и на них проверять точность на валидации и тесте, что собственно, тоже как то не очень.
Подскажите пожалуйста, как будет более правильней поступить в моем случае

 Профиль  
                  
 
 Re: Деление на train, val и test выборки
Сообщение16.02.2023, 06:55 


12/07/15
3322
г. Чехов
Что-то мне подсказывает, что аугментация некорректна для размножения дефектов... Вы можете мелкие фото показать?

 Профиль  
                  
 
 Re: Деление на train, val и test выборки
Сообщение16.02.2023, 13:05 


15/11/15
1080
Mihaylo в сообщении #1581805 писал(а):
детектирую дефекты

А дефекты у вас разных видов рассматриваются?

 Профиль  
                  
 
 Re: Деление на train, val и test выборки
Сообщение17.02.2023, 18:41 


29/12/09
366
Mihaylo в сообщении #1581805 писал(а):
Что-то мне подсказывает, что аугментация некорректна для размножения дефектов... Вы можете мелкие фото показать?

Фотки к сожалению показать не могу, так как есть маркировка на продукции. Дефекты - трещины, царапены, потертости. Думаю, что если повернуть трещину, то нормально аугментируется

 Профиль  
                  
 
 Re: Деление на train, val и test выборки
Сообщение18.02.2023, 11:03 
Заслуженный участник


08/04/08
8562
alexey007, у Вас может быть случай отсутствия дефектов?
Идея такая: можно попытаться накачать побольше фоток (хотя бы сотни) с дефектами и без дефектов, разметить их и обучить нейронку на большом неспецифичном датасете. А потом можно дофайнтюнить несколько верхних слоев сетки на вашем специфичном датасете с аугментациями. 16 фоток - это очень мало. Тест мне кажется должен быть без аугментаций.

 Профиль  
                  
 
 Re: Деление на train, val и test выборки
Сообщение18.02.2023, 12:09 


12/07/15
3322
г. Чехов
alexey007
Ну хотя бы объясните, как эти фото появляются? Их делают смартфоном с руки? Аугментация - это какой-то карго-культ в данном случае, думаю.

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 6 ] 

Модераторы: Karan, Toucan, PAV, maxal, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group