gudok
|
|
|
|
|
Рег.: 09.09.2005
|
Сообщений: 940
|
|
Рейтинг: 531
|
|
построить график распределения по набору дискретных значений
17.10.2008 18:38
|
|
|
Задача следующая: есть программа, которая запускается много раз. Каждый раз записывается время работы программы. То есть, в итоге есть набор времен выполнения, например {1 секунда, 2.5 секунд, 10 секунд, 1 секунда, 3 секунды,...}. Всего в наборе порядка 100,000 значений.
Как и с помощью чего (mathcad, mapple, руками, etc) построить график вероятности того, сколько времени программа будет работать для произвольного запуска?
// Воспоминания тервера подсказывают только слова "плотность распределения" и "мат. ожидание". 
|
|
wildschwein
|
gegen bolschewismus
|
|
|
|
Рег.: 24.01.2005
|
Сообщений: 35861
|
|
Рейтинг: 7474
|
|
Re: построить график распределения по набору дискретных значений
[re: gudok]
17.10.2008 18:40
|
|
|
|
Dan_Te
|
remember
|
|
|
|
Рег.: 28.12.2004
|
Сообщений: 7905
|
|
Рейтинг: 6784
|
|
Re: построить график распределения по набору дискретных значений
[re: wildschwein]
17.10.2008 18:50
|
|
|
Че еще за кернел денсити?..
1. Записываем данные в текстовый файл (в эксель сто тысяч измерений не влезут) 2. Открываем его стат.пакетом (Statistica, SPSS) 3. Строим гистограмму
На гистограмме можно менять число отрезков разбиения, тем самым увеличивать точность гистограммы.
Если же нужна именно функция плотности, то вопрос: как автор топика планирует ее в дальнейшем использовать? И вообще, в каком виде она должна быть? Функцию ведь просто так в компьютере не задашь.
|
|
wildschwein
|
gegen bolschewismus
|
|
|
|
Рег.: 24.01.2005
|
Сообщений: 35861
|
|
Рейтинг: 7474
|
|
Re: построить график распределения по набору дискретных значений
[re: Dan_Te]
17.10.2008 18:52
|
|
|
Ну он просил именно функцию плотности.
Quote:
In statistics, kernel density estimation (or Parzen window method, named after Emanuel Parzen) is a non-parametric way of estimating the probability density function of a random variable. As an illustration, given some data about a sample of a population, kernel density estimation makes it possible to extrapolate the data to the entire population.
Quote:
Although less smooth density estimators such as the histogram density estimator can be made to be asymptotically consistent, others are often either discontinuous or converge at slower rates than the kernel density estimator. Rather than grouping observations together in bins, the kernel density estimator can be thought to place small "bumps" at each observation, determined by the kernel function. The estimator consists of a "sum of bumps" and is clearly smoother as a result (see below image).
|
|
Dan_Te
|
remember
|
|
|
|
Рег.: 28.12.2004
|
Сообщений: 7905
|
|
Рейтинг: 6784
|
|
Re: построить график распределения по набору дискретных значений
[re: wildschwein]
17.10.2008 19:13
|
|
|
Не, это я понял, википедию прочитал. Просто я раньше не особо видел вообще такую штуку.
Понятно, что с ее помощью можно получить некую гладкую функцию, похожую на плотность. И где-то такая штуковина используется. Но я не думаю, что это тот самый случай.
В любом случае, нужно понять, зачем автору вообще плотность, что он будет с ней делать? Если f(x) - эмпирическая плотность, он планирует туда подставлять разные иксы и смотреть, какое будет значение, то формула, указанная для кернел денсити будет не особо удобной, поскольку там сумма по всем имеющимся наблюдениям (сто тысяч), долго суммировать придется.
|
|
wildschwein
|
gegen bolschewismus
|
|
|
|
Рег.: 24.01.2005
|
Сообщений: 35861
|
|
Рейтинг: 7474
|
|
Re: построить график распределения по набору дискретных значений
[re: Dan_Te]
17.10.2008 19:15
|
|
|
Quote:
Просто я раньше не особо видел вообще такую штуку.
К примеру, это во всяких экономических штуках, типа эконометрики, используется. Может и правда нафиг не нужно такое автору. Просто автор не гистограмму просил - я все-таки думаю, что такое гистограмма, он знает.
|
|
gudok
|
|
|
|
|
Рег.: 09.09.2005
|
Сообщений: 940
|
|
Рейтинг: 531
|
|
Re: построить график распределения по набору дискретных значений
[re: Dan_Te]
17.10.2008 20:10
|
|
|
В ответ на:
В любом случае, нужно понять, зачем автору вообще плотность, что он будет с ней делать?
Плотность мне не нужна, мне нужен график, где по оси X - время, по оси - Y - вероятность.
|
|
size_18
|
Я - РУССКИЙ
|
|
|
|
Рег.: 29.03.2005
|
Сообщений: 30527
|
|
Рейтинг: -822
|
|
Re: построить график распределения по набору дискретных значений
[re: gudok]
17.10.2008 20:11
|
|
|
ну че сложного-то посчитать в скольки случаях реализовалрсь 2ю5 секунды, в скольки 3, в скольки 5 ?
а потом их построить?
|
Можешь - сделай, не можешь - заткнись. |
|
Dan_Te
|
remember
|
|
|
|
Рег.: 28.12.2004
|
Сообщений: 7905
|
|
Рейтинг: 6784
|
|
Re: построить график распределения по набору дискретных значений
[re: gudok]
18.10.2008 00:21
|
|
|
Йопт. В ответ на:
Плотность мне не нужна, мне нужен график, где по оси X - время, по оси - Y - вероятность
А плотность - это по-твоему что такое?
********************* Вообще, машинное время дискретно, но заметить эту дискретность в рамках эксперимента нереально. Поэтому полагаем, что время работы программы - непрерывная случайная величина. Для нее вероятность принять каждое конкретное значение равно нулю. Если тебе нужно именно то, что ты написал ("по оси X - время, по оси - Y - вероятность"), то можешь построить график нуля и радоваться.
Если же тебе нужно приближение графика плотности (а именно это тебе наверняка и нужно), то строй гистограмму.
|
|