2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




Начать новую тему Ответить на тему
 
 Задачка по распознаванию изображений
Сообщение25.08.2016, 19:00 
Заслуженный участник
Аватара пользователя


28/04/16
2388
Внутри ускорителя
Добрый день, Всем.
Тут по работе пришлось немного поработать руками (даже, о ужас!, встать из-за компьютера :facepalm: ).
Суть: понадобились экспериментальные данные из не очень давней статьи (начало 1970х). Но, к сожалению, pdf-ка, выложенная на сайте журнала (хорошего) оказалась не очень качественная: текст хорошо читается, но вот таблицы (2 шт.) были опубликованы ну оооочень мелким шрифтом, так что дефолтное качество скана статей сделало многие цифры плохо читаемыми. :cry: В итоге я промучился делая "отцифровку" этих таблиц вручную (т.к. AdobeReader эти данные даже за текст не счел). Во время работы пометил (на всякий случай) цифры, в которых сомневался. Потом я вспомнил, что этот журнал имеется в библиотеке в бумажном виде. По этой бумажной версии я и восстановил правильные значения.
Поэтому у меня на руках оказались несколько наборов данных:
1. сами цифровые изображения таблиц,
2. то, что я прочел с этих изображений $+$ комментарии по поводу сомнительных цифр,
3. реальные значения.
И вдруг мне подумалось, что это отличный набор данных для машинного обучения по задаче распознавания изображений. :D А поскольку это заняло определённое количество времени и сил, то решил выложить эти данные тут. Вдруг эта задача позволит ИИ быстрее захватить Мир кому понадобятся для курсовой или диплома (а мне жалко их так выкидывать). :lol:

Собственно данные:

Таблица #1:
Изображение
Численные значения:
Код:
  I(me)       B(me)      |         I(true)     B(true)
-------------------------------------------------------------
   18.0         6.0      |           18.0         6.0
   -1.8         8.5      |           -1.8         8.5
   -9.1         8.9      |           -9.1         8.9
  -13.4        10.5      |          -13.4        10.5
   -8.2        11.5      |           -8.2        11.5
   -4.3        12.9      |           -4.3        12.9
   -0.4        14.1      |           -0.4        14.1
    0.0        15.7      |            0.0        15.7
   -0.3        17.2      |           -0.3        17.2
   -0.6       !18.8      |           -0.6        18.8
    3.3        20.6      |            3.3        20.6
   14.3        22.1      |           14.3        22.1
  !32.1        23.5      |           32.1        23.5
   53.6        25.0      |           53.6        25.0
   69.7        26.4      |           69.7        26.4
   75.3        37.3      |           75.3        27.3
  !64.0        28.4      |           64.0        28.4
   37.1        29.2      |           37.1        29.2
    6.5        30.0      |            6.5        30.0
  -21.0        30.4      |          -21.0        30.4
  -25.7        31.0      |          -25.7        31.0
  -32.8        31.2      |          -12.8        31.2
  !34.1        31.4      |           14.1        31.4
   40.4        31.6      |           40.4        31.6
   58.8        31.6      |           58.8        31.6
   67.4        31.7      |           67.4        31.7
   66.1        31.6      |           66.1        31.6
   61.0        31.4      |           61.0        31.4
   50.5        31.2      |           50.5        31.2
   42.0        30.8      |           42.0        30.8
   31.3        30.4      |           31.3        30.4
   20.7        29.9      |           20.7        29.9
   14.7        29.3      |           14.7        29.3
  !10.0        28.9      |           10.0        28.9
    4.9        28.3      |            4.9        28.3
    0.0       !27.7      |            0.0        27.7
   -3.2        27.0      |           -3.2        27.0
    0.2        26.2      |            0.2        26.2
######################################################################
   13.3        25.3      |           13.5        25.3
   32.8        34.4      |           32.8        24.4
   69.4        23.4      |           59.4        23.4
   66.1        22.3      |           66.1        22.3
   63.4       !21.8      |           63.4        21.1
  !48.7        19.8      |           48.7        19.8
   26.9        18.5      |           26.9        18.5
    7.5        17.1      |            7.5        17.1
   -4.6        15.7      |           -4.6        15.7
  -10.1        14.1      |          -10.1        14.1
  !-9.0        12.6      |           -9.0        12.6
   -4.3        11.0      |           -4.3        11.0
   -0.4         9.4      |           -0.4         9.4
    2.0         7.8      |            2.0         7.8
    5.2         6.3      |            5.2         6.3
    7.7         5.0      |            7.7         5.0
   10.5         3.6      |           10.5         3.6
  !15.0         2.3      |           15.0         2.3
  !18.5         1.1      |           18.5         1.1
  !18.2         0.0      |           18.2         0.0
   13.7        -1.0      |           13.7        -1.0
    5.3        -2.0      |            5.3        -2.0
   -6.2        -2.9      |           -6.1        -2.9
  -18.2        -3.6      |          -18.2        -3.8
  -24.8        -4.7      |          -24.8        -4.7
  -26.8        -5.4      |          -26.8        -5.4
  -23.9        -6.2      |          -23.9        -6.2
  -17.0        -6.8      |          -17.0        -6.8
   -8.0        -7.5      |           -8.0        -7.5
    0.0        -8.1      |            0.0        -8.1
    5.0        -8.7      |            5.0        -8.7
    6.3        -9.4      |            6.3        -9.4
    4.6       -10.0      |            4.6       -10.0
   -0.1       -10.6      |           -0.1       -10.6
   -2.6       -11.2      |           -2.6       -11.2
   -6.2       -11.0      |           -6.2       -11.8
-------------------------------------------------------------



Таблица #2:
Изображение
Численные значения:
Код:
     I(me)       B(me)         |         I(true)     B(true)
-------------------------------------------------------------
    -276.9      -233.2         |         -276.9      -233.2
    -270.4      -223.2         |         -270.4      -223.2
    -261.4      -211.0         |         -261.4      -211.0
    -239.1      -200.7         |         -239.1      -200.7
    -203.7      -189.0         |         -203.7      -189.0
   !-150.6      -176.2         |         -150.6      -176.2
     -93.6      -162.8         |          -93.6      -162.8
     -45.4      -149.9         |          -45.4      -149.9
    !-17.7      -134.6         |          -17.7      -134.6
     -33.6      -121.3         |          -33.6      -121.5
     -79.2      -105.7         |          -79.2      -105.7
    -153.1       -93.2         |         -153.1       -93.2
    -203.1       -79.3         |         -203.1       -79.3
    -206.8       -65.5         |         -206.8       -65.5
   !-164.7       -53.6         |         -164.7       -53.6
     -77.0       -41.7         |          -77.0       -41.7
       0.0       -30.8         |            0.0       -30.8
      53.7       -19.9         |           53.7       -19.9
     !63.7       -10.9         |           83.7       -10.9
     !69.3        -2.0         |           89.3        -2.0
     !61.4         7.0         |           81.4         7.0
     !65.9        14.9         |           65.9        14.9
      43.6        21.8         |           45.6        21.8
      24.3        28.3         |           24.8        28.3
       6.3        34.2         |            6.3        34.2
      -5.0        39.2         |           -5.0        39.2
     -14.1        44.1         |          -14.1        44.1
     -21.7        48.6         |          -21.7        48.6
     -26.6        52.5         |          -26.6        52.5
     -26.2        56.0         |          -28.2        56.0
    !-11.0        59.5         |          -11.3        59.5
      35.6        62.5         |           35.6        62.5
      99.8        65.4         |           99.8        65.4
     161.1        68.4         |          161.1        68.4
     193.0        70.3         |          193.8        70.3
     185.2        72.8         |          185.2        72.8
     145.2        74.8         |          145.2        74.8
      93.4        76.2         |           93.4        76.2
      17.0        77.8         |           47.0        77.8
     !17.1        79.3         |           17.1        79.3
      !8.8        80.2         |            8.8        80.2
      17.5        81.2         |           17.5        81.2
      31.9        81.7         |           31.9        81.7
      45.4        82.3         |           45.4        82.3
      62.2        82.7         |           62.2        82.7
      75.2        82.8         |           75.2        82.8
      88.0        83.2         |           88.0        83.2
     101.0        83.3         |          101.0        83.3
     116.0        83.2         |          116.0        83.2
     127.3        82.8         |          127.3        82.7
     127.2        82.3         |          127.2        82.3
     117.4        81.7         |          117.4        81.7
      95.6        80.7         |           95.6        80.7
      69.0        79.3         |           69.0        79.3
      42.2       !78.3         |           42.2        78.3
     !28.5        76.7         |           28.5        76.7
      18.6        75.3         |           18.6        75.3
      29.9        73.4         |           29.9        73.4
      53.2        71.9         |           53.2        71.9
      77.3        70.4         |           77.3        70.4
     !93.1        68.4         |           95.1        68.4
     103.9        66.4         |          103.9        66.4
     103.9        64.5         |          103.9        64.5
      96.7        32.5         |           96.7        62.5
      81.6        60.5         |           81.6        60.5
      67.2        58.5         |           67.2        58.5
      52.0        56.6         |           52.0        56.6
      41.4        53.6         |           41.4        53.6
      31.2        51.6         |           31.2        51.6
      21.3        48.7         |           21.3        48.7
      17.5        46.7         |           17.5        46.7
      17.4        44.8         |           17.4        44.8
      22.8        41.8         |           22.8        41.8
      29.4        39.4         |           29.4        39.4
      39.4        36.9         |           39.4        36.9
      51.4        34.4         |           51.4        34.4
      58.3        31.4         |           58.3        31.4
      58.4        28.9         |           58.4        28.9
      51.1        25.9         |           51.1        25.9
      34.0        23.4         |           36.0        23.4
      23.1        20.9         |           23.1        20.9
      !7.0        17.9         |            7.0        17.9
      -1.1        15.4         |           -1.1        15.4
      -3.4        12.9         |           -3.4        12.9
#########################################################################
      -3.9         9.9         |           -3.9         9.9
      -3.4         7.0         |           -3.4         7.0
      -5.0         4.0         |           -5.0         4.0
      -1.7         1.5         |           -1.7         1.5
       0.0        -2.0         |            0.0        -2.0
       2.4        -4.5         |            2.4        -4.5
      !3.6       !-6.0         |            5.8        -8.0
       7.2       -11.0         |            7.2       -11.0
       6.0       -14.0         |            6.0       -14.0
      -5.7       -17.5         |           -5.7       -17.5
     -18.1       -20.9         |          -18.1       -20.9
     -28.1       -24.0         |          -28.1       -24.0
     -38.3       -27.9         |          -38.3       -27.9
     -44.9      !-31.4         |          -44.9       -31.4
     -30.1       -34.9         |          -50.1       -34.9
     -49.6       -38.9         |          -49.6       -38.9
     -49.9       -42.8         |          -49.9       -42.8
     -48.9       -46.4         |          -48.9       -46.4
     -49.0       -49.8         |          -49.0       -49.8
    !-52.7      !-53.9         |          -52.7       -53.9
     -54.9       -56.9         |          -54.9       -56.9
     -57.9       -60.9         |          -57.9       -60.9
     -62.0       -63.9         |          -62.0       -63.9
     -63.8       -66.9         |          -63.8       -66.9
     -67.5       -69.4         |          -67.5       -69.4
     -70.8       -71.9         |          -70.8       -71.9
     -69.1       -73.9         |          -69.1       -73.9
     -71.2      !-75.4         |          -71.2       -75.4
     -75.4       -76.4         |          -75.4       -76.4
     -77.8       -77.3         |          -77.8       -77.3
     -78.1       -77.0         |          -78.1       -77.8
     -75.0       -78.8         |          -75.0       -78.8
     -76.7       -78.8         |          -76.7       -78.8
     -78.7      !-79.8         |          -78.7       -79.8
     -78.3      !-79.8         |          -78.3       -79.8
     -77.1       -80.3         |          -77.1       -80.3
     -79.4       -91.4         |          -79.4       -91.4
     -83.6       -83.1         |          -83.6       -83.1
     -86.9       -84.4         |          -86.9       -84.4
     -94.0       -85.9         |          -94.0       -85.9
     -96.8       -87.9         |          -96.8       -87.9
     -97.3       -89.9         |          -97.3       -89.9
     -98.5       -91.9         |          -98.5       -91.9
    -101.2       -93.9         |         -101.2       -93.9
     -90.2       -96.9         |          -90.2       -96.9
     -97.9       -99.4         |          -97.9       -99.4
     -97.9      -101.8         |          -97.9      -101.8
     -97.9      -103.9         |          -97.9      -103.9
     -97.0      -105.8         |          -97.0      -105.8
     -97.8      -106.8         |          -97.8      -106.8
    -101.8      -108.3         |         -101.8      -108.3
   !-103.5      -109.8         |         -103.5      -109.8
    -105.9      -110.4         |         -105.9      -110.4
    -109.9      -110.9         |         -109.9      -110.9
    -113.2      -110.4         |         -113.2      -110.4
    -115.3      -109.9         |         -115.3      -109.9
    -114.7     !-108.9         |         -114.7      -108.9
    -111.2      -106.3         |         -111.2      -106.3
    -107.7      -103.9         |         -107.7      -103.9
    -102.9      -100.6         |         -102.9      -100.6
     -98.9      !-95.9         |          -98.9       -95.9
     -92.9       -91.9         |          -92.9       -91.9
     -86.9       -86.9         |          -86.9       -86.9
     -79.5       -81.9         |          -79.5       -81.9
     -74.0       -76.9         |          -74.0       -76.9
    !-68.2       -72.0         |          -68.2       -72.0
     -62.6       -66.9         |          -62.6       -66.9
     -55.9       -62.0         |          -55.9       -62.0
    !-31.6       -56.4         |          -51.6       -56.4
     -40.3       -50.9         |          -40.3       -50.9
     -35.1       -44.5         |          -35.1       -44.5
     -27.5       -37.0         |          -27.5       -37.0
     -25.6       -31.9         |          -25.6       -31.9
     -22.6      !-24.5         |          -22.6       -24.5
     -19.6       -16.5         |          -19.6       -16.5
     -12.1       !-8.5         |          -12.1        -8.5
       0.0         0.0         |            0.0         0.0
      !5.3        !8.5         |            5.3         8.5
      10.0        17.5         |           10.0        17.5
      18.2       !24.0         |           18.2        28.0
     !28.4        39.0         |           28.4        39.0
      39.9        52.9         |           39.9        52.9
      55.2        65.9         |           55.2        65.9
     107.6        79.9         |          107.6        79.9
-------------------------------------------------------------



P.S. Легенда в отцифрованых таблицах:
1. "разрыв" в таблицах обозначен символом /#\+/
2. "(me)" обозначает данные полученные мной из картинки
3. "(true)" обозначает истинные значения полученные "с бумажки"
4. перед теми значениями, в которых я сомневался, стоят восклицательные знаки ("!").

P.P.S. не знал куда эту тему отправить, просьба к админам помочь с перемещением в адекватное место (например в Пургаторий :lol: ).

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ 1 сообщение ] 

Модераторы: Karan, Toucan, PAV, maxal, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group