Ну вот некоторые соображения. Во-первых, рассмотрим частный случай, согласно которому события

и

несовместные, т.е. одновременно никогда не происходят. Тогда из Ваших данных можно сразу определить приближенно их вероятности как частоты, и получим модель, которая данным противоречить не будет. И вроде как мы никак не сможем проверить, обосновано ли наше предположение о несовместности или нет.
В общем случае можно задать модель тремя числовыми параметрами:

,

и

.
(Можно рассматривать другие виды параметризации, например, рассматривать в качестве параметров

и

. Это удобнее тем, что обе величины друг с другом не связаны и принимают любые значения от 0 до 1.)
В рамках первой параметризации на три переменных нужно три уравнения. Первое очевидно:

. Другие нужно брать из данных или из априорных соображений.
Ваши данные заведомо дают следующую информацию: отношение числа раз, сколько происходило событие

, к числу наступлений события

, дает оценку на соотношение между их истинными вероятностями. Ведь общее число экспериментов нам хотя и неизвестно, но по крайней мере оно одно и то же для

и

. Таким образом, мы можем статистически оценить величину

, что дает второе уравнение.
А вот можно ли получить из Ваших данных еще одно уравнение, я не знаю. Сходу ничего не видно.
В крайнем случае мы можем принять предположение о том, что события

и

происходят независимо. Это точно дает третье необходимое условие и задачу можно решить. Допустимо ли такое предположение - это нужно решить исходя из содержательного смысла данных событий.