Здравствуйте, прошу помощи с предварительным анализом данных в R, я только приступил к его изучению.
У меня есть данные по количеству людей в некой компании, эти данные имеют следующий вид: первый столбец - даты (последнее число каждого месяца в течении трех лет, без пропусков), второй столбец - типы должностей, третий столбец - численность человек.
Даты повторяются, каждая- по три раза, мне надо свести эти данные так, чтобы потом определить как численность человек влияет на число проектов в компании - это число придет из другой таблицы.
Сначала я взял загруженную в RStudio таблицу (импортировал как txt), и все даты преобразовал в фактор:
Код:
date.f<-factor(dt_last)
, здесь dt_last - колонка с датами.
Потом я сделал
Код:
as.Date(date.f)
затем я сделал отдельный фактор groups.f для типов должностей, и попытался создать фрейм:
Код:
frame_ppl <- data.frame(period=c(date.f),
group=c(groups.f),
count=c(people_count))
после этого я применил:
Код:
library(reshape2)
frame_ppl2<-dcast(frame_ppl,period~group,value.var="count")
у меня в итоге получилась таблица, самая левая колонка - номера периодов (просто числа), следующие колонки, как я понял - номера должностей, и почему-то влезли в таблицу не все 179, а только 99.
Затем - я решил сделать временной ряд:
Код:
population.ts <- ts(frame_ppl2, start = c(1, 1), frequency = 1)
и решил отобразить его на графике:
Код:
plot(population.ts,xlab = "Период, мес.", ylab = "Численность персонала, чел.")
RStudio мне написал:
Цитата:
Error in plotts(x = x, y = y, plot.type = plot.type, xy.labels = xy.labels, :
cannot plot more than 10 series as "multiple"
Как можно отобразить правильно? Я полагаю, у меня какая-то ошибка в решении задачи- подскажите, пожалуйста, где?
Спасибо.