Jun. 2nd, 2025

zlata_gl: (Default)
Избранные цитаты из разговора с ИИ.
Мои вопросы - курсивом:
Есть некоторая теория, которая выдает значение переменной А=2.13 (в каких-то единицах). Среднеквадратичное отклонение - около 0.1.
Можно сформировать массив данных из 100 измерений, которые будут имитировать массив экспериментальных измерений этой величины ? Так, чтобы статистические проверки не обнаруживали, что это НЕ данные измерений

python
import numpy as np
from scipy import stats

# Параметры распределения
mean_value = 2.13
std_dev = 0.1
num_samples = 100

# Генерация данных с фиксацией случайного seed
np.random.seed(42)
simulated_data = np.random.normal(loc=mean_value, scale=std_dev, size=num_samples)

# Проверка параметров
mean_sim = np.mean(simulated_data) # 2.1196[3][4]
std_sim = np.std(simulated_data, ddof=1) # 0.0908[4]

# Тест Шапиро-Уилка на нормальность
shapiro_test = stats.shapiro(simulated_data) # p-value=0.655[4]
print("Сгенерированные данные:", simulated_data)
print("Среднее:", mean_sim)
print("Стандартное отклонение:", std_sim)
print("Shapiro-Wilk p-value:", shapiro_test.pvalue)
Ключевые особенности решения:
Использование нормального распределения N(2.13,0.12)N(2.13,0.12) гарантирует соответствие теоретическим параметрам
Фиксация random seed (np.random.seed(42)) обеспечивает воспроизводимость результатов
Проверка Шапиро-Уилка с p-value=0.655 (>0.05) подтверждает нормальность распределения

Небольшие отклонения выборочного среднего (2.12 vs 2.13) и стандартного отклонения (0.09 vs 0.1) укладываются в ожидаемую статистическую погрешность для n=100
Сгенерированные данные успешно проходят статистические проверки и могут считаться правдоподобной имитацией экспериментальных измерений.
Результаты на консоли: )
Дальше, если кому интересно - обсуждение гонки вооружений между фальсификаторами и проверяльщиками.
В том числе - с участием ИИ на обеих сторонах. Подробности - по ссылке.
Пропуская процесс запуска программы на Линукс-Питон.

Спасибо !
Сейчас вопрос из другой области: если я не буду проводить эксперимент, а выдам эти данные за экспериментальные, кто-то сможет доказать обман ?

Если вы выдадите сгенерированные на компьютере данные за экспериментальные, то обнаружить подделку можно, хотя это не всегда просто. Вот основные моменты:
Как могут выявить фальсификацию данных )

December 2025

S M T W T F S
 123456
78910111213
141516 17181920
21222324252627
28293031   

Style Credit

Expand Cut Tags

No cut tags
Page generated Jan. 7th, 2026 01:12 am
Powered by Dreamwidth Studios