forked from urfu-2015/verstka-tasks-1
-
Notifications
You must be signed in to change notification settings - Fork 0
/
Copy pathindex.html
448 lines (439 loc) · 24.6 KB
/
index.html
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
384
385
386
387
388
389
390
391
392
393
394
395
396
397
398
399
400
401
402
403
404
405
406
407
408
409
410
411
412
413
414
415
416
417
418
419
420
421
422
423
424
425
426
427
428
429
430
431
432
433
434
435
436
437
438
439
440
441
442
443
444
445
446
447
448
<!DOCTYPE html>
<html lang="ru">
<head>
<meta charset="utf-8">
<meta name="keyword" content="Yandex, Яндекс">
<meta name="copyright" content="Яндекс">
<title>Блог компании Яндекс</title>
<link href="style.css" rel="stylesheet">
</head>
<body>
<div class="content">
<header>
<h1 class="center">Блог компании Яндекс.</h1>
</header>
<article>
<h2 class="center">ЯНДЕКС.ПОЧТА: КАК МЫ ИЗМЕРЯЕМ СКОРОСТЬ ЗАГРУЗКИ И УЛУЧШАЕМ ЕЁ</h2>
<p>
Если ваш сайт медленно грузится, вы рискуете тем, что люди не оценят ни то,
какой он красивый, ни то, какой он удобный. Никому не понравится, когда все
тормозит. Мы регулярно добавляем в Яндекс.Почту новую функциональность,
иногда — исправляем ошибки, а это значит, у нас постоянно появляются новый код
и новая логика. Всё это напрямую влияет на скорость работы интерфейса.
</p>
<h3>Что мы измеряем</h3>
<ol type="1">
<li>Этапы первой загрузки:</li>
<ul>
<li>подготовка;</li>
<li>загрузка статики (<abbr title="HyperText Transfer Protocol">HTTP</abbr>-запрос и парсинг);</li>
<li>исполнение модулей;</li>
<li>инициализация базовых объектов;</li>
<li>отрисовка.</li>
</ul>
<li>Этапы отрисовки любой страницы:</li>
<ul>
<li>подготовка к запросу на сервер;</li>
<li>запрос данных с сервера;</li>
<li>шаблонизация;</li>
<li>обновление <abbr title="Document Object Model">DOM</abbr>.</li>
</ul>
</ol>
<p>
— <q>Ок, теперь у нас есть метрики, мы можем отправить их на сервер</q> - говорим мы<br>
— <q>Что же дальше?</q> - вопрошаете вы<br>
— <q>А давай построим график!</q> - отвечаем мы<br>
— <q>А что будем считать?</q> - уточняете вы
</p>
<p>
Как вы знаете, <dfn>медиана</dfn> – это серединное, а не среднее значение в выборке.<br>
Если у нас имеются числа 1, 2, 2, 3, 8, 10, 20, то медиана – 3, а среднее – 6,5.<br>
В общем случае медиана отлично показывает, сколько грузится средний пользователь.
</p>
<p>
В случае ускорения или замедления медиана, конечно, изменится. Но она не может
рассказать, сколько пользователей ускорилось, а сколько замедлилось.
</p>
<dl>
<dt>APDEX</dt>
<dd>
<p>
– метрика, которая сразу говорит: хорошо или плохо. Метрика
работает очень просто. Мы выбираем временной интервал <var>[0;t]</var>,
такой, что если время показа страницы попало в него, то пользователь счастлив.
Берем еще один интервал, <var>(t;4t]</var> (в четыре раза больше первого),
и считаем, что если страница показана за это время, то пользователь в целом
удовлетворен скоростью работы, но уже не настолько счастлив. И применяем формулу:
</p>
<p>
<math xmlns="http://www.w3.org/1998/Math/MathML">
<mfrac>
<mrow>
<mi>кол-во счастливых пользователей</mi>
<mo>+</mo>
<mfrac>
<mrow>
<mi>кол-во удовлетворенных</mi>
</mrow>
<mrow>
<mi>2</mi>
</mrow>
</mfrac>
</mrow>
<mrow>
<mi>кол-во всех</mi>
</mrow>
</mfrac>
<mi>.</mi>
</math>
</p>
<p>
Получается значение от нуля до единицы, которое, видимо, лучше всего показывает,
хорошо или плохо работает почта.
</p>
</dd>
</dl>
<h3>Как мы измеряем</h3>
<p>
Сейчас модуль обновления сам логирует все свои стадии, и можно легко понять
причину замедления: медленнее стал отвечать сервер либо слишком долго
выполняется JavaScript. Выглядит это примерно так:
</p>
<pre class="codeContent"><code>this.timings['look-ma-im-start'] = Date.now();
this.timings['look-ma-finish'] = Date.now();
</code></pre>
<p>
C помощью <code>Date.now()</code> мы получаем текущее время. Все тайминги собираются и при
отправке рассчитываются. На этапах разница между “end” и “start” не считается,
а все вычисления производятся в конце:
</p>
<pre class="codeContent"><code>var totalTime = this.timings['look-ma-finish'] - this.timings['look-ma-im-start'];
</code></pre>
<p>И на сервер прилетают подобные записи:</p>
<pre class="codeContent"><code>serverResponse=50&domUpdate=60
</code></pre>
<h3>Как мы ускоряем</h3>
<p>
Чтобы снизить время загрузки почты при выходе новых версий,
мы уже делаем следующее:
</p>
<ul>
<li>включаем <abbr title="GNU Zip">gzip</abbr>;</li>
<li>выставляем заголовки кэширования;</li>
<li>
фризим <abbr title="Cascading Style Sheets">CSS</abbr>,
<abbr title="JavaScript">JS</abbr>, шаблоны и картинки;
</li>
<li>используем <abbr title="Content Delivery Network">CDN</abbr>;</li>
</ul>
<p>
Мы подумали: <q>А что если хранить где-то старую версию файлов, а при выходе новой
передавать только diff между ней и той, которая сохранена у пользователя?</q><br>
В браузере же останется просто наложить патч на клиенте.
</p>
<p>
На самое деле эта идея не нова. Уже существуют стандарты для HTTP — например,
RFC 3229 «Delta encoding in HTTP» и «Google SDHC», — но по разным причинам они
не получили должного распространения в браузерах и на серверах.
</p>
<p>
Мы же решили сделать свой аналог на JS. Чтобы реализовать этот метод обновления,
начали искать реализации diff на JS. На популярных хостингах кода нашли
библиотеки:
</p>
<ul class="noMarkList">
<li>- VCDiff</li>
<li>- google-diff-patch-match</li>
</ul>
<p>Для окончательного выбора библиотеки нам нужно сравнить:</p>
<table>
<tbody>
<tr>
<th>Библиотека</th>
<th>IE 9</th>
<th>Opera 12</th>
</tr>
<tr>
<td>vcdiff</td>
<td>8</td>
<td>5</td>
</tr>
<tr>
<td>google diff</td>
<td>1363</td>
<td>76</td>
</tr>
</tbody>
</table>
<p>
После того как мы определились с библиотекой для диффа, нужно определиться с тем,
где и как хранить статику на клиенте.
</p>
<p>Формат файла с патчами для проекта выглядит так:</p>
<pre class="codeContent"><code>[
{
"k": "jane.css",
"p": [patch],
"s": 4554
},
{
"k": "jane.css",
"p": [patch],
"s": 4554
}
]
</code></pre>
<p>
То есть это обычный массив из объектов. Каждый объект — отдельный ресурс. У
каждого объекта есть три свойства. <code>k</code> — названия ключа в
<code>localStorage</code> для этого ресурса. <code>p</code> — патч для ресурса,
который сгенерировал vcdiff. <code>s</code> — чексумма для
ресурса актуальной версии, чтобы потом можно было проверить правильность
наложения патча на клиенте. Чексумма вычисляется по алгоритму Флетчера.
</p>
<dl>
<dt>
Алгоритм Бройдена — Флетчера — Гольдфарба — Шанно
(<abbr title="Broyden — Fletcher — Goldfarb — Shanno algorithm">BFGS<abbr>)
</dt>
<dd>
<p>
— итерационный метод численной оптимизации, предназначенный для
нахождения локального максимума/минимума нелинейного функционала
без ограничений.
</p>
<p class="codeContent">
дано
<math xmlns="http://www.w3.org/1998/Math/MathML">
<mi>ε</mi>
<mtext>,</mtext>
<msub>
<mi>x</mi>
<mn>0</mn>
</msub>
</math><br>
инициализировать
<math xmlns="http://www.w3.org/1998/Math/MathML">
<msub>
<mi>H</mi>
<mn>0</mn>
</msub>
</math><br>
<math xmlns="http://www.w3.org/1998/Math/MathML">
<mi>k</mi>
<mo>=</mo>
<mn>0</mn>
</math><br>
while
<math xmlns="http://www.w3.org/1998/Math/MathML">
<mfenced separators="" open="‖" close="‖">
<mrow>
<mo>∇</mo>
<msub>
<mi>f</mi>
<mi>k</mi>
</msub>
</mrow>
</mfenced>
<mo>></mo>
<mi>ε</mi>
</math><br>
 найти направление
<math xmlns="http://www.w3.org/1998/Math/MathML">
<msub>
<mi>p</mi>
<mi>k</mi>
</msub>
<mo>=</mo>
<mo>-</mo>
<msub>
<mi>C</mi>
<mi>k</mi>
</msub>
<mi>∇</mi>
<msub>
<mi>f</mi>
<mi>k</mi>
</msub>
</math><br>
 вычислить
<math xmlns="http://www.w3.org/1998/Math/MathML">
<msub>
<mi>x</mi>
<mi>k+1</mi>
</msub>
<mo>=</mo>
<msub>
<mi>x</mi>
<mi>k</mi>
</msub>
<mo>+</mo>
<msub>
<mi>α</mi>
<mi>k</mi>
</msub>
<msub>
<mi>p</mi>
<mi>k</mi>
</msub>
<mtext>,</mtext>
<msub>
<mi>α</mi>
<mi>k</mi>
</msub>
</math>
удовлятворяет условиям Вольфе<br>
 обозначить
<math xmlns="http://www.w3.org/1998/Math/MathML">
<msub>
<mi>s</mi>
<mi>k</mi>
</msub>
<mo>=</mo>
<msub>
<mi>x</mi>
<mi>k+1</mi>
</msub>
<mo>-</mo>
<msub>
<mi>x</mi>
<mi>k</mi>
</msub>
<mtext>и</mtext>
<msub>
<mi>y</mi>
<mi>k</mi>
</msub>
<mo>=</mo>
<mo>∇</mo>
<msub>
<mi>f</mi>
<mi>k+1</mi>
</msub>
<mo>-</mo>
<mo>∇</mo>
<msub>
<mi>f</mi>
<mi>k</mi>
</msub>
</math><br>
 вычислить
<math xmlns="http://www.w3.org/1998/Math/MathML">
<msub>
<mi>C</mi>
<mi>k+1</mi>
</msub>
</math><br>
 
<math xmlns="http://www.w3.org/1998/Math/MathML">
<mi>k</mi>
<mo>=</mo>
<mi>k</mi>
<mo>+</mo>
<mn>1</mn>
</math><br>
end
</p>
</dd>
</dl>
<p>Почему именно алгоритм Флетчера, а не другие популярные алгоритмы вроде:</p>
<dl>
<dt>CRC16/32</dt>
<dd>
- алгоритм нахождения контрольной суммы, предназначенный для проверки
целостности данных
</dd>
</dl>
<dl>
<dt>md5</dt>
<dd>
- 128-битный алгоритм хеширования. Предназначен для создания «отпечатков»
или дайджестов сообщения произвольной длины и последующей проверки
их подлинности.
</dd>
</dl>
<p>Потому что он быстрый, компактный и легок в реализации.</p>
<h3>Итог</h3>
<p>Фактически мы экономим 80-90% трафика. Размер загружаемой статитки в байтах:<p>
<table>
<tbody>
<tr>
<th>Релиз</th>
<th>С патчем</th>
<th>Без патча</th>
</tr>
<tr>
<td>7.7.20</td>
<td>397</td>
<td>174 549</td>
</tr>
<tr>
<td>7.7.21</td>
<td>383</td>
<td>53 955</td>
</tr>
<tr>
<td>7.7.22</td>
<td>483</td>
<td>3 955</td>
</tr>
</tbody>
</table>
<address class="author">
Автор: @doochik<br>
С++ разработик<br>
Электронная почта: ([email protected])<br>
Компания: Яндекс<br>
</address>
<hr>
<section>
<h3>Комментарии (3):</h3>
<article class="comment">
<div class="commenter">
<address>Mogaika ([email protected])</address>
<time>30 ноября 2014 в 17:05</time>
</div>
<p>
А можете привести сравнение, на сколько быстрее грузится lite версия?
</p>
</article>
<article class="comment">
<div class="commenter">
<address>JIguse ([email protected])</address>
<time>29 ноября 2014 в 21:30</time>
</div>
<p>
Спасибо за статью, познавательно. Здорово, что Яндекс делится некоторыми
подробностями о внутренней работе сервисов.
</p>
</article>
<article class="comment">
<div class="commenter">
<address>Brister ([email protected])</address>
<time>24 ноября 2014 в 13:13</time>
</div>
<p>
(кол-во счастливых пользователей + кол-во удовлетворенных / 2) / (кол-во всех).
Получается значение от нуля до единицы, которое, видимо, лучше всего показывает,
хорошо или плохо работает почта.
наверное все-таки от 0.5 до 1
</p>
</article>
<article class="comment">
<div class="commenter">
<address>alexeimois ([email protected])</address>
<time>22 ноября 2014 в 17:35</time>
</div>
<p>
Мы измеряем скорость загрузки с помощью Яндекс.Метрики:
help.yandex.ru/metrika/reports/monitoring_timing.xml
</p>
</article>
</section>
</article>
<footer>
<address>© Яндекс, [email protected], Хохрякова, 10</address>
</footer>
</div>
</body>
</html>