2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




Начать новую тему Ответить на тему
 
 Помогите с бакой...
Сообщение24.10.2007, 10:24 


24/10/07
4
Привет!
Посоветуйте тему для бакалаврской. Учусь на ИТ(информационные технологии). Сначала хотел писать программу для прогнозирования рынка Форекс, но отговорили. Люди убившие на это несколько лет говорят что там хаос, спрогнозировать невозможно...
Посоветуйте, может у кого есть иньересные идеи..
Спасибо.

 Профиль  
                  
 
 
Сообщение24.10.2007, 16:58 


02/12/06
5
IT довольно широкая область, какая у Вас специальность?

 Профиль  
                  
 
 
Сообщение24.10.2007, 22:50 


24/10/07
4
GinGreen писал(а):
IT довольно широкая область, какая у Вас специальность?


В принципе, сейчас я занимаюсь базами данных.

 Профиль  
                  
 
 
Сообщение24.10.2007, 23:23 
Заслуженный участник
Аватара пользователя


17/10/05
3709
:evil:
Одна из интересных современных областей — temporal и spatial БД. Т.е., базы данных, в которых ключом являются географические и/или временные координаты. При этом запрос выглядит примерно как «найти объекты в таком-то диапазоне/окрестности», т.е. поиск неточный. При этом типовые размеры — $10^6$$10^8$ и много более записей.

 Профиль  
                  
 
 
Сообщение25.10.2007, 10:13 


24/10/07
4
незваный гость писал(а):
:evil:
Одна из интересных современных областей — temporal и spatial БД. Т.е., базы данных, в которых ключом являются географические и/или временные координаты. При этом запрос выглядит примерно как «найти объекты в таком-то диапазоне/окрестности», т.е. поиск неточный. При этом типовые размеры — $10^6$$10^8$ и много более записей.


хмм, хорошая идея. я знаю что гугл активно использует данную технологию. осталось только найти какуюнибудь актуальную проблему в этой области, которую мне по силам будет решить..

 Профиль  
                  
 
 
Сообщение25.10.2007, 17:13 
Заслуженный участник


15/05/05
3445
USA
faust_ писал(а):
незваный гость писал(а):
Одна из интересных современных областей — temporal и spatial БД...
... осталось только найти какуюнибудь актуальную проблему в этой области, которую мне по силам будет решить..
Для temporal БД: бухгалтерская база данных, в которой легко строить запросы типа: "текущий баланс на 14:35 12-го сентября позапрошлого года" или "Моменты времени с 5 по 10 декабря прошлого года, когда оборот по банковскому счету превышал средний уровень более чем в 1.5 раза".
Как вариант: доп.модуль для известного бух.пакета, реализующий темпоральные запросы на существующей БД.
Это в какой-то степени ближе к задачам OLAP и Data Warehouse, чем к OLTP.

 Профиль  
                  
 
 
Сообщение25.10.2007, 18:46 
Заслуженный участник
Аватара пользователя


17/10/05
3709
:evil:
Вообще-то, я имел в виду другие задачи: например, имеются данные о состоянии процесса (100-10,000 параметров, 100-1000ms) за длительный период. Интересует, например, выборка данных за 30 секунд до и 10 минут после события и т.п.

(Есть и более экзотические варианты. Например, для энергосистем требуются данные с разрешением не хуже 1ms. Но такие данные, хвала Всевышнему, подготавливают и хранят по событиям. Любопытно, что требуются данные до события! Кроме того, эти данные нужно влить в поток редких данных.)

Другой пример — есть карта (ну очень большая) и есть достопримечательности с координатами. Надо выбрать те, которые показывать на конкретном фрагменте карты (т.е. те, которые попали в прямоугольник). Если этого мало, то ещё один типовой запрос: найти торговые точки не далее предписанного расстояния. Мало? тогда торговые точки не далее указанного расстояния по дорогам.

~~~

Есть ещё одна связанная задача: время в данных. У неё несколько аспектов, дающих простор для исследования.

(1) Формат времени. Я имею в виду не двоичное представление, а какое именно время хранить. Например, MS Outlook грешил тем, что события привязывались к абсолютному времени. В результате, при переходе на летнее время всё съезжало. Часовые пояса — это полбеды, а беда — изменяющиеся законы. Хорошо, если данные не нужны через неделю, а если они хранятся годами? Скажем, в США закон о летнем времени изменился в прошлом году. А в этом какая-то страна (Венесуэла?) изменила часовой пояс. Поэтому доверять алгоритмам библиотеки С перевод времени нельзя.

(2) Служба времени. Мы привыкли к часам, но склонны забывать, что часы нужно корректировать. Между тем, в БД расхождение часов в распределённой системе хорошо видно. Что делать? Массировать данные перед записью — это не плохо, а очень плохо. Во-первых, это подделка документа. Во-вторых, это потеря информации. Поэтому и вопрос — что делать.

(3) Ну и совсем мелкий вопрос — время и корректировки часов. Представьте себе, корректируются часы. Может измениться длительность событий, что плохо. Представьте себе, скажем, корректировка произошла в момент измерения скорости автомобиля. И скорость (по записям) возросла (или упала) до совершенно нереальной. А есть и маленькие радости, вроде високосных секунд…

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 7 ] 

Модераторы: Karan, Toucan, PAV, maxal, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group