2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




 
 Задачка по распознаванию изображений
Сообщение25.08.2016, 19:00 
Аватара пользователя
Добрый день, Всем.
Тут по работе пришлось немного поработать руками (даже, о ужас!, встать из-за компьютера :facepalm: ).
Суть: понадобились экспериментальные данные из не очень давней статьи (начало 1970х). Но, к сожалению, pdf-ка, выложенная на сайте журнала (хорошего) оказалась не очень качественная: текст хорошо читается, но вот таблицы (2 шт.) были опубликованы ну оооочень мелким шрифтом, так что дефолтное качество скана статей сделало многие цифры плохо читаемыми. :cry: В итоге я промучился делая "отцифровку" этих таблиц вручную (т.к. AdobeReader эти данные даже за текст не счел). Во время работы пометил (на всякий случай) цифры, в которых сомневался. Потом я вспомнил, что этот журнал имеется в библиотеке в бумажном виде. По этой бумажной версии я и восстановил правильные значения.
Поэтому у меня на руках оказались несколько наборов данных:
1. сами цифровые изображения таблиц,
2. то, что я прочел с этих изображений $+$ комментарии по поводу сомнительных цифр,
3. реальные значения.
И вдруг мне подумалось, что это отличный набор данных для машинного обучения по задаче распознавания изображений. :D А поскольку это заняло определённое количество времени и сил, то решил выложить эти данные тут. Вдруг эта задача позволит ИИ быстрее захватить Мир кому понадобятся для курсовой или диплома (а мне жалко их так выкидывать). :lol:

Собственно данные:

Таблица #1:
Изображение
Численные значения:
Код:
  I(me)       B(me)      |         I(true)     B(true)
-------------------------------------------------------------
   18.0         6.0      |           18.0         6.0
   -1.8         8.5      |           -1.8         8.5
   -9.1         8.9      |           -9.1         8.9
  -13.4        10.5      |          -13.4        10.5
   -8.2        11.5      |           -8.2        11.5
   -4.3        12.9      |           -4.3        12.9
   -0.4        14.1      |           -0.4        14.1
    0.0        15.7      |            0.0        15.7
   -0.3        17.2      |           -0.3        17.2
   -0.6       !18.8      |           -0.6        18.8
    3.3        20.6      |            3.3        20.6
   14.3        22.1      |           14.3        22.1
  !32.1        23.5      |           32.1        23.5
   53.6        25.0      |           53.6        25.0
   69.7        26.4      |           69.7        26.4
   75.3        37.3      |           75.3        27.3
  !64.0        28.4      |           64.0        28.4
   37.1        29.2      |           37.1        29.2
    6.5        30.0      |            6.5        30.0
  -21.0        30.4      |          -21.0        30.4
  -25.7        31.0      |          -25.7        31.0
  -32.8        31.2      |          -12.8        31.2
  !34.1        31.4      |           14.1        31.4
   40.4        31.6      |           40.4        31.6
   58.8        31.6      |           58.8        31.6
   67.4        31.7      |           67.4        31.7
   66.1        31.6      |           66.1        31.6
   61.0        31.4      |           61.0        31.4
   50.5        31.2      |           50.5        31.2
   42.0        30.8      |           42.0        30.8
   31.3        30.4      |           31.3        30.4
   20.7        29.9      |           20.7        29.9
   14.7        29.3      |           14.7        29.3
  !10.0        28.9      |           10.0        28.9
    4.9        28.3      |            4.9        28.3
    0.0       !27.7      |            0.0        27.7
   -3.2        27.0      |           -3.2        27.0
    0.2        26.2      |            0.2        26.2
######################################################################
   13.3        25.3      |           13.5        25.3
   32.8        34.4      |           32.8        24.4
   69.4        23.4      |           59.4        23.4
   66.1        22.3      |           66.1        22.3
   63.4       !21.8      |           63.4        21.1
  !48.7        19.8      |           48.7        19.8
   26.9        18.5      |           26.9        18.5
    7.5        17.1      |            7.5        17.1
   -4.6        15.7      |           -4.6        15.7
  -10.1        14.1      |          -10.1        14.1
  !-9.0        12.6      |           -9.0        12.6
   -4.3        11.0      |           -4.3        11.0
   -0.4         9.4      |           -0.4         9.4
    2.0         7.8      |            2.0         7.8
    5.2         6.3      |            5.2         6.3
    7.7         5.0      |            7.7         5.0
   10.5         3.6      |           10.5         3.6
  !15.0         2.3      |           15.0         2.3
  !18.5         1.1      |           18.5         1.1
  !18.2         0.0      |           18.2         0.0
   13.7        -1.0      |           13.7        -1.0
    5.3        -2.0      |            5.3        -2.0
   -6.2        -2.9      |           -6.1        -2.9
  -18.2        -3.6      |          -18.2        -3.8
  -24.8        -4.7      |          -24.8        -4.7
  -26.8        -5.4      |          -26.8        -5.4
  -23.9        -6.2      |          -23.9        -6.2
  -17.0        -6.8      |          -17.0        -6.8
   -8.0        -7.5      |           -8.0        -7.5
    0.0        -8.1      |            0.0        -8.1
    5.0        -8.7      |            5.0        -8.7
    6.3        -9.4      |            6.3        -9.4
    4.6       -10.0      |            4.6       -10.0
   -0.1       -10.6      |           -0.1       -10.6
   -2.6       -11.2      |           -2.6       -11.2
   -6.2       -11.0      |           -6.2       -11.8
-------------------------------------------------------------



Таблица #2:
Изображение
Численные значения:
Код:
     I(me)       B(me)         |         I(true)     B(true)
-------------------------------------------------------------
    -276.9      -233.2         |         -276.9      -233.2
    -270.4      -223.2         |         -270.4      -223.2
    -261.4      -211.0         |         -261.4      -211.0
    -239.1      -200.7         |         -239.1      -200.7
    -203.7      -189.0         |         -203.7      -189.0
   !-150.6      -176.2         |         -150.6      -176.2
     -93.6      -162.8         |          -93.6      -162.8
     -45.4      -149.9         |          -45.4      -149.9
    !-17.7      -134.6         |          -17.7      -134.6
     -33.6      -121.3         |          -33.6      -121.5
     -79.2      -105.7         |          -79.2      -105.7
    -153.1       -93.2         |         -153.1       -93.2
    -203.1       -79.3         |         -203.1       -79.3
    -206.8       -65.5         |         -206.8       -65.5
   !-164.7       -53.6         |         -164.7       -53.6
     -77.0       -41.7         |          -77.0       -41.7
       0.0       -30.8         |            0.0       -30.8
      53.7       -19.9         |           53.7       -19.9
     !63.7       -10.9         |           83.7       -10.9
     !69.3        -2.0         |           89.3        -2.0
     !61.4         7.0         |           81.4         7.0
     !65.9        14.9         |           65.9        14.9
      43.6        21.8         |           45.6        21.8
      24.3        28.3         |           24.8        28.3
       6.3        34.2         |            6.3        34.2
      -5.0        39.2         |           -5.0        39.2
     -14.1        44.1         |          -14.1        44.1
     -21.7        48.6         |          -21.7        48.6
     -26.6        52.5         |          -26.6        52.5
     -26.2        56.0         |          -28.2        56.0
    !-11.0        59.5         |          -11.3        59.5
      35.6        62.5         |           35.6        62.5
      99.8        65.4         |           99.8        65.4
     161.1        68.4         |          161.1        68.4
     193.0        70.3         |          193.8        70.3
     185.2        72.8         |          185.2        72.8
     145.2        74.8         |          145.2        74.8
      93.4        76.2         |           93.4        76.2
      17.0        77.8         |           47.0        77.8
     !17.1        79.3         |           17.1        79.3
      !8.8        80.2         |            8.8        80.2
      17.5        81.2         |           17.5        81.2
      31.9        81.7         |           31.9        81.7
      45.4        82.3         |           45.4        82.3
      62.2        82.7         |           62.2        82.7
      75.2        82.8         |           75.2        82.8
      88.0        83.2         |           88.0        83.2
     101.0        83.3         |          101.0        83.3
     116.0        83.2         |          116.0        83.2
     127.3        82.8         |          127.3        82.7
     127.2        82.3         |          127.2        82.3
     117.4        81.7         |          117.4        81.7
      95.6        80.7         |           95.6        80.7
      69.0        79.3         |           69.0        79.3
      42.2       !78.3         |           42.2        78.3
     !28.5        76.7         |           28.5        76.7
      18.6        75.3         |           18.6        75.3
      29.9        73.4         |           29.9        73.4
      53.2        71.9         |           53.2        71.9
      77.3        70.4         |           77.3        70.4
     !93.1        68.4         |           95.1        68.4
     103.9        66.4         |          103.9        66.4
     103.9        64.5         |          103.9        64.5
      96.7        32.5         |           96.7        62.5
      81.6        60.5         |           81.6        60.5
      67.2        58.5         |           67.2        58.5
      52.0        56.6         |           52.0        56.6
      41.4        53.6         |           41.4        53.6
      31.2        51.6         |           31.2        51.6
      21.3        48.7         |           21.3        48.7
      17.5        46.7         |           17.5        46.7
      17.4        44.8         |           17.4        44.8
      22.8        41.8         |           22.8        41.8
      29.4        39.4         |           29.4        39.4
      39.4        36.9         |           39.4        36.9
      51.4        34.4         |           51.4        34.4
      58.3        31.4         |           58.3        31.4
      58.4        28.9         |           58.4        28.9
      51.1        25.9         |           51.1        25.9
      34.0        23.4         |           36.0        23.4
      23.1        20.9         |           23.1        20.9
      !7.0        17.9         |            7.0        17.9
      -1.1        15.4         |           -1.1        15.4
      -3.4        12.9         |           -3.4        12.9
#########################################################################
      -3.9         9.9         |           -3.9         9.9
      -3.4         7.0         |           -3.4         7.0
      -5.0         4.0         |           -5.0         4.0
      -1.7         1.5         |           -1.7         1.5
       0.0        -2.0         |            0.0        -2.0
       2.4        -4.5         |            2.4        -4.5
      !3.6       !-6.0         |            5.8        -8.0
       7.2       -11.0         |            7.2       -11.0
       6.0       -14.0         |            6.0       -14.0
      -5.7       -17.5         |           -5.7       -17.5
     -18.1       -20.9         |          -18.1       -20.9
     -28.1       -24.0         |          -28.1       -24.0
     -38.3       -27.9         |          -38.3       -27.9
     -44.9      !-31.4         |          -44.9       -31.4
     -30.1       -34.9         |          -50.1       -34.9
     -49.6       -38.9         |          -49.6       -38.9
     -49.9       -42.8         |          -49.9       -42.8
     -48.9       -46.4         |          -48.9       -46.4
     -49.0       -49.8         |          -49.0       -49.8
    !-52.7      !-53.9         |          -52.7       -53.9
     -54.9       -56.9         |          -54.9       -56.9
     -57.9       -60.9         |          -57.9       -60.9
     -62.0       -63.9         |          -62.0       -63.9
     -63.8       -66.9         |          -63.8       -66.9
     -67.5       -69.4         |          -67.5       -69.4
     -70.8       -71.9         |          -70.8       -71.9
     -69.1       -73.9         |          -69.1       -73.9
     -71.2      !-75.4         |          -71.2       -75.4
     -75.4       -76.4         |          -75.4       -76.4
     -77.8       -77.3         |          -77.8       -77.3
     -78.1       -77.0         |          -78.1       -77.8
     -75.0       -78.8         |          -75.0       -78.8
     -76.7       -78.8         |          -76.7       -78.8
     -78.7      !-79.8         |          -78.7       -79.8
     -78.3      !-79.8         |          -78.3       -79.8
     -77.1       -80.3         |          -77.1       -80.3
     -79.4       -91.4         |          -79.4       -91.4
     -83.6       -83.1         |          -83.6       -83.1
     -86.9       -84.4         |          -86.9       -84.4
     -94.0       -85.9         |          -94.0       -85.9
     -96.8       -87.9         |          -96.8       -87.9
     -97.3       -89.9         |          -97.3       -89.9
     -98.5       -91.9         |          -98.5       -91.9
    -101.2       -93.9         |         -101.2       -93.9
     -90.2       -96.9         |          -90.2       -96.9
     -97.9       -99.4         |          -97.9       -99.4
     -97.9      -101.8         |          -97.9      -101.8
     -97.9      -103.9         |          -97.9      -103.9
     -97.0      -105.8         |          -97.0      -105.8
     -97.8      -106.8         |          -97.8      -106.8
    -101.8      -108.3         |         -101.8      -108.3
   !-103.5      -109.8         |         -103.5      -109.8
    -105.9      -110.4         |         -105.9      -110.4
    -109.9      -110.9         |         -109.9      -110.9
    -113.2      -110.4         |         -113.2      -110.4
    -115.3      -109.9         |         -115.3      -109.9
    -114.7     !-108.9         |         -114.7      -108.9
    -111.2      -106.3         |         -111.2      -106.3
    -107.7      -103.9         |         -107.7      -103.9
    -102.9      -100.6         |         -102.9      -100.6
     -98.9      !-95.9         |          -98.9       -95.9
     -92.9       -91.9         |          -92.9       -91.9
     -86.9       -86.9         |          -86.9       -86.9
     -79.5       -81.9         |          -79.5       -81.9
     -74.0       -76.9         |          -74.0       -76.9
    !-68.2       -72.0         |          -68.2       -72.0
     -62.6       -66.9         |          -62.6       -66.9
     -55.9       -62.0         |          -55.9       -62.0
    !-31.6       -56.4         |          -51.6       -56.4
     -40.3       -50.9         |          -40.3       -50.9
     -35.1       -44.5         |          -35.1       -44.5
     -27.5       -37.0         |          -27.5       -37.0
     -25.6       -31.9         |          -25.6       -31.9
     -22.6      !-24.5         |          -22.6       -24.5
     -19.6       -16.5         |          -19.6       -16.5
     -12.1       !-8.5         |          -12.1        -8.5
       0.0         0.0         |            0.0         0.0
      !5.3        !8.5         |            5.3         8.5
      10.0        17.5         |           10.0        17.5
      18.2       !24.0         |           18.2        28.0
     !28.4        39.0         |           28.4        39.0
      39.9        52.9         |           39.9        52.9
      55.2        65.9         |           55.2        65.9
     107.6        79.9         |          107.6        79.9
-------------------------------------------------------------



P.S. Легенда в отцифрованых таблицах:
1. "разрыв" в таблицах обозначен символом /#\+/
2. "(me)" обозначает данные полученные мной из картинки
3. "(true)" обозначает истинные значения полученные "с бумажки"
4. перед теми значениями, в которых я сомневался, стоят восклицательные знаки ("!").

P.P.S. не знал куда эту тему отправить, просьба к админам помочь с перемещением в адекватное место (например в Пургаторий :lol: ).

 
 
 [ 1 сообщение ] 


Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group