Математика


СОБСТВЕНА СТРУКТУРА НА МАТРИЦА

Съдържание на учебника по линейна алгебра

Нека да сме благодарни на проф. Михаил Константинов за разрешението да четем "Елементи на линейната алгебра: вектори и матрици" online.

10.1 Определения

Нека А = [ai,j] е реална или комплексна n х n матрица. Числото λ се нарича собствена стойност (или характеристично число) на матрицата А когато съществува ненулев n-вектор х, такъв че
Ах = λx.          (10.1)
В този случай векторът х се нарича десен собствен вектор (или накратко собствен вектор) на матрицата А, съответстващ на собствената стойност λ. Двойката (λ, х) се нарича собствена двойка на матрицата А. Множеството от всички собствени двойки се нарича собствена структура на матрицата А. Ще отбележим, че е възможно матрицата А да е реална, но собствената стойност λ и/или съответният собствен вектор x да са комплексни.
Като умножим двете страни на равенството (10.1) отляво с xH получаме хHАх = λ||x||2, откъдето следва израз за собствената стойност чрез собствения вектор:
λ = xHAx/||x||2
Ще напомним, че тук
||x|| = √|x1|2 + ..... + |xn|2
е евклидовата норма на вектора х.

Както ще видим след малко, собствените стойности на една матрица се определят еднозначно. Обаче собственият вектор, съответстващ на дадена собствена стойност, не е определен еднозначно. Така например когато х е собствен вектор, то и векторът ах, където а е ненулева константа, също е собствен вектор. Възможно е също една матрица да има няколко линейно независими собствени вектора, съответстващи на една и съща собствена стойност. Често се приема, че собствените вектори са нормирани в смисъл, че ||x|| = 1.

Пример 10.1 Да разгледаме единичната матрица In. Ако (А, x) е собствена двойка на In, то
Inx = x = xIn,
откъдето (1 — λ)x = 0. Тъй като х ≠ 0, то по необходимост λ = 1. Така единичната матрица има единствена собствена стойност, равна на 1, и всеки ненулев вектор е неин собствен вектор. В частност матрицата In има n на брой линейно неза-висими собствени вектори.

Ще напомним, че дори когато матрицата А е реална, някоя нейна собствена стойност λ може да е комплексна. В този случай съответният собствен вектор х също е комплексен. Изобщо, от всичките осем комбинации за А, λ и х в зависимост от това коя величина е реална и коя комплексна, не е възможна само комбинацията на реална матрица А, комплексна собствена стойност λ и реален собствен вектор х. Също така, ако А и λ са реални, то х е или реален, или чисто имагинерен вектор. Поради това ще се условим, че собственият вектор е реален когато и матрицата и съответната собствена стойност са реални.

Някои автори запазват термините собствена стойност и собствен вектор само за случая, когато А принадлежи Fnxn и λ принадлежи F, x принадлежи Fn. При тази терминология една реална матрица може да има само реални собствени стойности и спектърът на някои матрици, например се оказва празно. Впрочем, всички тези терминологични проблеми отпадат, ако се договорим да разглеждаме реалните матрици като комплексни мат-рици с нулева имагинерна част.

От горните определения следва, че ако (λ, х) е собствена двойка на матрицата А, то
(^λIn - А)х = 0.          (10.2)
Тъй като x ≠ 0, то необходимо е матрицата ^λIn - А да е особена. Действително, в противен случай уравнението (10.2) ще има единствено решение, което би трябвало да е х = 0, а ние знаем, че х ≠ 0. Следователно
χA(λ) := det(^λIn - А) = 0.          (10.3)
Това уравнение се нарича характеристично уравнение на матрицата А. То е алгебрично уравнение от n-та степен и може да се запише във вида
λn - c1λn-1 + ..... + (-1)ncn = 0,
където сk е сумата на главните минори от ред k на матрицата А. В частност

Полиномът χA се нарича характперистичен полином на матрицата А.

Пример 10.2 Характеристичният полином на матрицата In е (λ — 1)n, докато минималният полином на тази матрица е λ - 1.

Пример 10.3 Характеристичният полином на матрицата

е λn и е равен на нейния минимален полином.
Кратността на собствената стойност λ на матрицата А като корен на нейния характеристичен полином се нарича алгебрична кратност на λ. Броят на линейно независимите собствени вектори, съответстващи на собствената стойност λ, се нарича геометрична кратност на λ.
Съгласно една важна теорема в алгебрата всяко алгебрично уравнение от n-та степен с реални или комплексни коефициенти има n корена (между тях може да има кратни). Следователно характеристичното уравнение (10.2) на матрицата A принадлежи Fnxn има n корена λ1,..., λn с отчитане на алгебричната им кратност. Наборът {λ1,..., λn} се нарича спектър на матрицата A и се бележи със spect(A). Ако различните помежду си собствени стойности са λ1,..., λm с алгебрични кратности k1,..., km то спектърът на А се състои от k1 на брой екземпляра λ1, k2 на брой екземпляра λ2 и т.н. до km на брой екзем-пляра λm. Така например спектърът на единичната матрица In се състои от n екземпляра на числото 1. Впрочем, под спектър на матрица някои автори разбират само множеството от различни помежду си нейни собствени стойности.

Така характеристичният полином на матрицата А може да се запише във вида

Числото
rad(А) = maх{|λ| : λ принадлежи spect(A)} ≥ 0
се нарича спектрален радиус на квадратната матрица А. Това е радиусът на най-малкия централен кръг в комплексната равнина, който съдържа собствените стойности на А.

Матриците А, В принадлежи Fnxn се наричат подобни, ако съществува неособена матрица R принадлежи Fnxn, такава че АR = RВ. Подобните матрици А и В = R-1АR имат еднакви характеристични полиноми и в частност еднакви спектри. Действително, имаме
χB(λ) = det(λIn - B) = det(R-1(λIn - A)R)
= det(R-1)det(λIn - A)det(R)
= det(λIn - A) = χA(λ)
Обратното може и да не е вярно, т.е., две матрици с еднакви характеристични полиноми могат и да не са подобни. Действително, нека A принадлежи Fnxn е ненулева горно триъгълна матрица с нулев диагонал, а В = 0nxn. Тогава χA(λ) = χB(λ) = λn. Но А не може да е подобна на 0nxn, тъй като единствената подобна на нулевата матрица е тя самата.

Нека числото λ е собствена стойност на подобните матрици А и В =R-1AR. Тогава, ако х и у са съответните собствени вектори на А и В, то можем да приемем, че х = Rу. Действително, нека Ах = λх и Ву = λу. Оттук получаваме R-1ARу = λу и А(Rу) = λ(Rу). Следователно можем да изберем х = Rу.

Диагоналните матрици А = diag(λ1,..., λn) притежават редица приятни свойства, например

• spect(А) = {λ1,..., λn};

• ако еk е k-тият стълб на единичната матрица In, то (λk, ek) е собствена двойка на матрицата А;

• рангът на A е равен на броя на ненулевите числа λk;

• det(А) = λ1,..., λn.

Следователно интерес представлява да се определи при какви условия една квадратна матрица може да се приведе в диагонална форма чрез преобразувания на подобие.

Матрицата А принадлежи Fnxn се нарича диагонализируема (или матрица с проста структура) когато тя е подобна на диагонална матрица.

Необходимо и достатъчно условие за диагонализируемост на една матрица А принадлежи Fnxn е тя да притежава система от n линейно независими собствени вектори. Действително, да предположим, че А има n линейно независими собствени вектори r1,..., rn принадлежи Fn. Тогава можем така да номерираме собствените стойности λi на А, че да е изпълнено Аri = λiri, i = 1,..., n (естествено, не е необходимо собствените стойности да са различни помежду си). Да образуваме неособената матрица R := [r1,..., rn] принадлежи Fnxn. Имаме

където Л := diag(λ1,..., λn).
Обратно, да предположим, че съществува неособена матрица
R = [r1,..., rn] принадлежи Fnxn,
такава че матрицата Л := R-1АR е диагонална, т.е., Л = diag(λ1,..., λn). Тогава АR = RЛ, откъдето
[Аr1,..., Аrn] = [λ1r1,..., λnrn]
и
Аri = λiri, i = 1,...,n.
Тъй като матрицата R е неособена, то нейните стълбове ri формират система от n линейно независими вектори на матрицата А.

Горното доказателство не трябва да се схваща като практически алгоритъм за диагонализация на матрица. Действително, ключов момент тук е определянето на собствените стойности на матрицата, което на свой ред може да се окаже трудна изчислителна задача.

Достатъчно условие за диагонализируемост на матрицата А е нейните собствени стойности да са различни помежду си. По-долу ние ще докажем един по-общ резултат.

Нека λ1, ...., λm са различни помежду си собствени стойности на матрицата A принадлежи Fnxn (m ≤ n), на които съответст-ват собствените вектори r1, ..., rm принадлежи Fn. Тогава системата от вектори R := {r1,..., rm} е линейно независима. Действително, случаят m = 1 е тривиален. Нека следователно m > 1 и да допуснем, че системата R е линейно зависима. Тогава съществува нетривиална и равна на нула линейна комбинация с най-малък брой р ≤ m ненулеви коефициенти, например
α1r1,..., αprp]          (10.4)
Очевиднор p > 1, тъй като в противен случай от α1r1 = 0 и α1 ≠ 0 би следвало r1 = 0, което е невъзможно. Като умножим двете страни на (10.4) с А получаваме втора линейна комбинация
α1Ar1 + .... + αpArp = α1λ1r1 + .... + αpλprp = 0.          (10.5)
Умножаваме равенството (10.4) с λp и го изваждаме от (10.5), което дава
α11 - λp)r1 + .... + αp-1p-1 - λp)rp = 0.
Тъй като коефициентите α1,...,αp-1 са различни от нула и λi ≠ λp, i = 1, ..... ,p — 1, то последната линейна комбинация е нетривиална и е с р — 1 на брой ненулеви коефициенти. Но това противоречи на предположението, че най-малкият брой на ненулевите коефициенти в равните на нула линейни комбинации на вектори от R е р. Полученото противоречие показва, че системата R е линейно независима.

Матриците А, В принадлежи Fnxn се наричат едновременно диагонализируеми когато съществува неособена матрица R принадлежи Fnxn, такава че матриците R-1АR и R-1BR са диагонални. Матриците А, В принадлежи Fnxn комутират когато АВ = ВА.

Може да се покаже, че ако матриците А, В принадлежи Fnxn са диагонализируеми, то те комутират точно когато те са едновременно диагонализируеми. Този резултат се обобщава за произволен брой матрици.

Дори когато произведенията АВ и ВА на две матрици А и В са определени, те в общия случай са различни. Независимо от това в сила е един забележителен факт, а именно, че ненулевите (а възможно и някои от нулевите) собствени стойности на матриците АВ и ВА съвпадат. По-точно, в сила е следният резултат.

Нека А принадлежи Fmxn и В принадлежи Fnxm където за определеност сме приели m ≤ n. Тогава матрицата ВА принадлежи Fnxn има същите собствени стойности (с отчитане на алгебричните им кратности) като матрицата АВ принадлежи Fmxm, плюс още n — m нулеви собствени стойности, т.е.,
χBA(λ) = λn-mχBA(λ).
В частност, ако m = n и една от матриците А или В е неособена, то матриците АВ и ВА са подобни.

Действително, матрицата
матрицата R
е неособена (det(R) = 1) и
матрицата R<sup>-1</sup>
(докажете!). Освен това непосредствено се проверява, че

Следователно матриците М и N от ред m + n са подобни. Но собствените стойности на М са тези на АВ заедно с n нули, а собствените стойности на N са тези на ВА заедно с m нули. Тъй като собствените стойности на М и N съвпадат, първото твърдение е доказано.

За да докажем второто нека за определеност матрицата А е неособена. Тогава
АВ = А(ВА)А-1
т.е., матриците АВ и ВА са подобни.

Нека е дадена матрицата А принадлежи Fnxn. Подпространството L се съдържа Fn се нарича инвариантно относно А (или накратко А-инвариантно), ако за всеки вектор х принадлежи L е изпълнено Ax принадлежи L, т.е., ако AL се съдържа L, където
AL := {Ах : x принадлежи L}.
Нека сега λ е собствена стойност на матрицата А принадлежи Fnxn. Множеството
L(A, λ) := {Ах принадлежи Cn : Aх = λx} се съдържа Cn.
се нарича собствено подпространство на матрицата A асоциирано със собствената стойност λ. Така за всеки ненулев вектор х принадлежи L(А,λ) двойката (λ, x) е собствена двойка на матрицата А.

От това определение следва, че
L(А,λ) =Кеr(λIn - А).
Лесно се вижда, че всяко собствено подпространство на матрицата А е A-инвариантно (обратното може и да не е вярно).

Ясно е също, че размерността на L(А, λ) е равна на геометричната кратност на собствената стойност λ. Геометричната кратност на λ не надвишава съответната алгебрична кратност, но може да е по-малка. Ако за някое λ принадлежи spect(A) геометричната кратност е по-малка от алгебричната, то матрицата А се нарича дефектна. Съответно когато за всяко λ принадлежи spect(A) геометричната кратност на λ е равна на алгебричната, матрицата А е недефектна. Лесно се вижда, че матрицата А е диагонализируема точно когато тя е недефектна.

Когато всяка собствена стойност на А има единична геометрична кратност (независимо от алгебричната) матрицата А се нарича проста. Една матрица е едновременно проста и диагонализируема когато тя има различни помежду си собствени стойности.

10.2 Форма на Шур


Когато n х n матрицата А е комплексна, или когато тя е реална, но има комплексни собствени стойности, съществува унитарна n х n матрица U, такава че матрицата S := UHАU е горна триъгълна. Матрицата S се нарича форма на Шур (или накратко Шур форма) на матрицата А. Стълбовете на унитарната матрица U образуват Шур база на пространството Fn относно матрицата А. Диагоналните елементи si,i на S са собствените стойности на матрицата А.

Когато матрицата А е реална и има само реални собствени стойности, матрицата U може да се избере реална ортогонална. В този случай и Шур формата S на А също е реална.

Когато матрицата А е реална, но някои (или всички) от собствените й стойности са комплексни, може да се построи т.нар. реална Шур форма SR = VTАV на А. Тук матрицата V е реална ортогонална, а матрицата SR е реална блочно триъгълна с 1 х 1 или 2 x 2 блокове по диагонала. Блоковете с размер 2 x 2 отговарят на двойките комплексно спрегнати собствени стойности на А. Съвременните методи за пресмятане на собствената структура на матрица се основават на привеждането й във форма на Шур, вж. също глава 13.

10.3 Форма на Жордан

Нека са дадени матриците А, В принадлежи Fnxn. Един важен въпрос е да се установи дали тези матрици са подобни, т.е., дали съществува матрица R принадлежи GL(n,F), такава че АR = RB. Отговор на този въпрос се дава от т.нар. жорданова канонична форма на квадратна матрица.

Жорданов блок от ред 1 от първи тип J1(λ) със собствена стойност λ принадлежи F е самото число λ,
J1(λ) =λ принадлежи F.

Жорданов блок от ред m > 1 от първи тип Jm(λ) със собствена стойност λ принадлежи F е матрицата
Жорданов блок от ред m
са равни на 1 в позиции (i, i + 1), i = 1,..., m — 1, и на нула в останалите позиции. Матрицата Nm е нилпотентна като Nmm = 0.

Жордановият блок от първи тип е комплексна матрица при λ принадлежи C\R и реална матрица при λ принадлежи R.

Жорданов блок от ред 2 от втори тип К2(α,β) с комплексни собствени стойности λ = α + iβ принадлежи С, λ с черта = α - iβ принадлежи C, където числата α и β ≠ 0 са реални, е матрицата

Жорданов блок от ред 2m > 2 от втори тип К2m(α, β) с комплексни собствени стойности λ = α + iβ принадлежи С, λ с черта = α - iβ принадлежи C, където числата α и β ≠ 0 са реални, е матрицата
К2m(α,β) = Im ⊗ K2(&lapha;,β) + Nm ⊗ I20

Жорданова матрица е всяка блок-диагонална матрица с жорданови блокове по диагонала.

Блоковете на една блочно диагонална матрица могат да се разместват по диагонала с помощта на пермутационни преобpазувания на подобие. Нека например
J = diag(J1, J2) принадлежи Fn x n, J1 принадлежи Fmxm, Jm принадлежи F(n - m)x(n - m).
Тогава
РTJР = diag(J2,J1),
където

Поради горния факт се приема, че две жорданови матрици са неразличими (или еквивалентни) когато те се отличават само по подредбата на диагоналните си блокове.

Жорданова матрица, която съдържа само блокове от първи тип, може да се дефинира и като двудиагонална матрица, която има само единици и/или нули по наддиагонала си.

Един фундаментален факт в спектралната теория на матриците е, че всяка матрица е подобна на жорданова матрица.

Нека А принадлежи Fnxn. Неособената матрица U принадлежи Fnxn, такава че U-1AU е жорданова матрица, се нарича модална матрица на матрицата А. Когато матрицата А има пълен набор (т.е., n на брой) собствени вектори, те формират модална матрица.

Модалната матрица не е еднозначно определена. Така например, ако матрицата А с пълен набор собствени вектори има модална матрица U, то тя има и модални матрици D1U и UD2, където D1,D2 са произволни диагонални неособени матрици. Дори ако поискаме стълбовете на U да имат единична дължина, то наред с U модална матрица ще бъде и матрицата UD, където D е диагонална унитарна матрица.

Нека е дадена комплексната матрица А принадлежи Fnxn която има m различни помежду си собствени стойности λ1,..., λm с алгебрични кратности k1,..., km. Нека собствената стойност λi участва в рi ≥ 1 жорданови блока от първи тип с размери съответно ki,1 ≤ .... ≤ ki,pi. Тогава имаме
ki,1 + .... + ki,pi i = 1,..., m.
В частност, геометричната кратност на собствената стойност λi принадлежи pi. Вижда се също, че минималният полином на матрицата А в този случай е
минимален полином на А
Числата m, p1,... ,pm и кi,j, i = 1,... ,m, j = 1,... ,pi, се наричат аритметични инварианти на матрицата А относно действието на подобие
A → U-1AU, U принадлежи GL(n,С) на общата линейна група GL(n,C). Алгебричните инварианти относно това действие са собствените стойности λ1,..., λm на матрицата.

В зависимост от вида на матрицата А принадлежи Fnxn (комплексна или реална) и на нейния спектър spect(A) (съдържащ или не комплексни елементи) са възможни следните случаи.

1. Матрицата е комплексна или реална и има (поне една) комплексна собствена стойност. Тогава тя има комплексна жорданова форма с блокове от първи тип, като модалната матрица може и да е реална.

2. Матрицата е комплексна или реална, но има само реални собствени стойности. Тогава тя има реална жорданова форма с блокове от първи тип, като модалната матрица може и да е реална.

3. Матрицата е реална, но има (поне две) комплексни собствени стойности. Тогава тя има реална жорданова форма с блокове от втори тип, като модалната матрица в този случай е реална.

10.4 Квазижорданова форма

Жордановата форма е елегантно математическо средство за описание на действието на подобие на групата на неособените матрици в множеството на квадратните матрици. Тя обаче има някои особености, които я правят неудобна от практическа гледна точка и особено при извършване на пресмятания в крайна аритметика. Работата е там, че жордановата форма J на матрицата А може да е силно чуствителна или даже прекъсната като функция на А.

Модалната матрица U (или нейната обратна матрица U-1), такава че U-1АU = J, също може да е прекъсната като функция на А. Нещо повече, дори когато е непрекъсната, модалната матрица (или нейната обратна) може да е много чуствителна като функция на А. В частност възможно е малки изменения в А да доведат до големи изменения в U или U-1. Също така числото на обусловеност
соnd(U): ||U|| ||U-1||
на матрицата на модалната матрица U може да е много голямо и това да доведе до големи грешки от закръгляне при извършване на пресмятанията в машинна аритметика.

Тези явления са илюстрирани в следващите примери за матрици А = А(&еpsilon;) с размер 2 x 2, зависещи от реалния параметър ε ≥ 0. Във всички случаи модалната матрица U = [u1, u2] е избрана или с единични стълбове (||u1||2 = ||u2||1 = 1), или, когато това не е възможно, с единичен първи стълб (||u1||2 = 1). Когато матрицата А е жорданова, за определеност е прието U = I2.

Пример 10.4 Нека е дадена матрицата
пример 10.4
зависеща от реалния параметър ε ≥ 0. При ε > 0 жордановата форма на А(ε) е

а модалната матрица U(ε) и нейната обратна матрица U-1(ε) са

За числата на обусловеност на модалната матрица в спектралната норма и нормата на Фробениус имаме съответно

Вижда се, че обратната на модалната матрица не е ограничена при &еpsilon; → 0, като числото на обусловеност на модалната матрица има поведението на 1/√.

Да видим сега какво става при ε = 0. Тук матрицата А(0) е в жорданова форма,

Така имаме
limε → 0 = 02х2 ≠ J(0)
и следователно матричната функция ε → J(&еpsilon;) е прекъсната в точката ε = 0.

Модалната матрица U(ε) е ограничена, непрекъсната при ε > 0 и с прекъсване от първи род при ε = 0, като

Обратната матрица U-1(&еpsilon;) е неограничена при ε → 0, непрекъсната при ε > 0 и с прекъсване от втори род при ε = 0.

Пример 10.5 Матриците
пример 10.5
са квазижорданови (отличава се от жордановата по това, че при блоковете на първи (съответно втори) тип по наддиагонала (съответно по наднаддиагонала) ненулевите елементи са произволни положителни елементи). В съответните жорданови матрици елементите 0.001 и π, π щяха да са равни на 1.

За разлика от жордановата форма J на матрицата А , която е определена с точност до подреждането на блоковете по диагонала на J, квазижордановата форма не е определена еднозначно при матриците, които нямат пълен набор собствени вектори.

Пример 10.6 Матрицата
пример 10.6
има жорданова форма J = U-1AU и модална матрица както следва:

Същевременно А има безбройно много квазижорданови форми, параметризирани чрез параметъра ω

Този пример показва и това, че при една комплексна матрица с комплексен спектър, която не е в жорданова форма, модалната матрица може да е реална.

Квазижордановите форми и съответните им (квази) модал-ни матрици не са толкова чуствителни към смущения.

Пример 10.7 Матрицата А(&еpsilon;) от пример 10.6 се привежда в квазижорданова форма
пример 10.7
за всяко &еpsilon; ≥ 0. В този случай квазижордановата форма J и (квази) модалната матрица U (независеща от &еpsilon;) са непрекъснати функции за разлика от жордановата матрица и модалната матрица.

Пример 10.8 Матрицата
пример 10.8
има жорданова форма
и J(0) = diag(λ, λ) при ω = 0. Модалната матрица с минимално число на обусловеност е
U(ω) = diag(1,1/ω), ω ≠ 0
и U(0) = I2. Имаме
U-1(ω) = diag(1,ω), ω ≠ 0
и U-1(0) = I2. Следвателно
соnd2(A(ω)) = max{ω, 1/ω}, соndF(A(ω)) = ω + 1/ω, ω ≠ 0
и
соnd2(А(0)) = 1, соndF(A(0)) = 2.

Виждаме, че жордановата форма J(ω) е прекъсната в точката ω = 0, а числата на обусловеност на модалната матрица са неограничени при ω → 0 и ω → ∞. Същевременно квазижордановата форма е непрекъсната (самата матрица А(ω) е в квазижорданова форма), а (квази) модалната матрица винаги е I2 и е отлично обусловена.

10.5 Обобщена собствена структура

Едно обобщение на понятието собствена структура на матрица е както следва. Нека са дадени матриците А и В с еднакъв размер над полето F. Семейството
{λВ - А : λ принадлежи С},
където λ е параметър, се нарича матричен сноп. Така матричният сноп може да се разглежда като права в съответното линейно пространство от матрици, минаваща през матрицата — А и с направляваща матрица В. Когато това не води до недоразумения, матричният сноп се означава и като λВ — А.

Матричният сноп е квадратен когато участващите в него матрици са квадратни. По-нататък ще разглеждаме само квадратни снопове.

Матричният сноп е регулярен когато съществува λ0 принадлежи С, такова че матрицата λ0В — А е обратима. С други думи снопът не е регулярен точно когато е изпълнено тъждеството
det(λB - А) = 0.
Ако В = I полиномът det(λВ — А) е характеристичният полином на матрицата А и неговите корени са собствените стойности на А.

Нека А, В принадлежи Fnxn. Задачата за намиране на число λ и на ненулев вектор х, такива че
Ах = λВх,
се нарича обобщена задача за собствена структура. Съответно числото λ се нарича обобщена собствена стойност, а векторът х - обобщен собствен вектор.

Обобщените собствени стойности са корените на обобщеното характеристично уравнение
det(λB - А) = 0,
което е алгебрично уравнение от степен r := rank(В) ≤ n.

Матричните снопове λВ — А и λD — С се наричат еквивалентни, ако съществуват неособени n х n матрици U и V, такива че
С = UAV, D = UВV.
Тези снопове са унитарно (съответно ортогонално) еквивалентни, ако матриците U и V са унитарни (съответно ортогонални). Еквивалентните снопове имат еднакви обобщени собствени стойности.

Когато матрицата В е неособена можем да запишем
В-1Ах = λх
и следователно в този случай обобщената собствена структура е собствената структура на матрицата В-1А. В частност съществуват n на брой обобщени собствени стойности λ1,..., λn (с отчитане на алгебричната им кратност). При този подход матрицата В-1 не се формира, а матрицата X := В-1А се пресмята с помощта на n линейни алгебрични уравснения
Bx•j = а•j
за стълбовете х•j на X, където а•j са стълбовете на А.

Впрочем, дори когато матрицата В е неособена, пресмятането на обобщената собствена структура на снопа чрез собствената структура на матрицата В-1А на практика се избягва поради опасността на внасяне на неприсъщи на първоначалната задача грешки от закръгляне.

Така стандартната и обобщената задачи за собствена структура имат някои общи свойства, но са възможни и съществени различия.

Първо, възможно е да имаме сингулярен сноп, при който е изпълнено тъждеството (10.6). Тогава всяко число λ може да се разглежда като обобщена собствена стойност.

Второ, ако снопът е регулярен, но матрицата В е особена от ранг r, полиномът det(λВ — А) е от степен r < n. В този случай се приема, че освен корените на det(λB - A) = 0, които са r на брой с отчитане на алгебричната им кратност, обобщената задача има и n — r безкрайни собствени стойности. Действително, да запишем обобщената задача като
Вх = Ах/λ
и нека 0 ≠ х принадлежи Кеr(B), т.е., Вх = 0. Имаме Ах ≠ 0, тъй като в противен случай щеше да е изпълнено Ах = Вх = 0 и снопът би бил сингулярен. Тогава
0 = Ах/λ
и следва да приемем 1/λ = 0, откъдето λ = ∞. С помощта на неособени преобразувания
А → UАV, В → UВV
матричният сноп може да се приведе в т.нар. канонична форма на Кронекер, която е обобщение на каноничната форма на Жордан. От каноничната форма на Кронекер непосредствено се получава и обобщената собствена структура. Тази форма, обаче, рядко се използва за практически пресмятания поради високата си чуствителност спрямо изменения в данните А, В.

Чрез унитарни преобразувания
А → С = [ci,j] = UАV, В → D = [di,j] = UВV
където U, V принадлежи U(n), матриците А и В могат да се приведат едновременно в горна триъгълна форма, наречена обобщена форма на Шур. Тази форма се пресмята с помощта на т.нар. QZ алгоритъм на Молър и Стюърт, предложен през 1973 г. При това обобщената задача за собствени стойности се свежда до

Оттук получаваме системата от уравнения
di,iλ = ci,i, i = 1, ..... ,n,
където поради регулярността на снопа са изпълнени неравенствата
|di,i| + |ci,i| > 0, i = 1,...,n.
Следователно обобщените собствени стойности се определят от

Често се използва и следната симетрична формулировка на обобщената задача за собствени стойности. Търсят се числа λ и μ, които не са равни едновременно на нула, както и ненулев вектор х, такива че
μАх = λВх.
Тук опитът да наречем съответната двойка (λ, μ) ≠ (0,0) обобщена собствена стойност се натъква на проблема за неединственост. Действително, за всяко k ≠ 0 двойката (kλ, kμ) също би била обобщена собствена стойност. Поради това понятието обобщена собствена стойност на двойката матрици (А, В) се дефинира като множеството на всички (кλ,kμ), когато k пробягва множеството F\{0}.

Връзката на тази симетрична формулировка (при която се уеднаквяват ролите на матриците А и В) с първоначалната формулировка на обобщената задача за собствени стойности е както следва. Крайната собствена стойност λ при първоначалната формулировка отговаря на двойката (λ, 1) при симетричната формулировка, а безкрайната собствена стойност - на двойката (1,0).

При симетричната формулировка говорим за двойка матрици вместо за матричен сноп. Така например двойката А, В принадлежи Fnxn е сингулярна когато равенството det(μА — λВ) = 0 е изпълнено за всички λ, μ принадлежи F. В противен случай двойката е регулярна. С други думи двойката е регулярна точно когато съществуват числа λ0, μ0 принадлежи F, такива че det(μ0А — λ0В) ≠ 0. Очевидно има смисъл да разглеждаме обобщената задача за собствени стойности само за регулярни двойки защото при сингулярните матрични двойки всяко множество (kλ, kμ) (когато k пробягва F) е обобщена собствена стойност. В този случай ненулевият вектор се нарича обобщен десен собствен вектор (или само обобщен собствен вектор) на двойката (А,В).

Ненулевият вектор у, удовлетворяващ уравнението
μуHА = λуHВ,
се нарича обобщен ляв собствен вектор на двойката (А,В).

10.6 Чуствителност и числени аспекти

Да разгледаме първо задачата за намиране на собствената структура на матрицата А принадлежи Fnxn. Когато матрицата А има само прости (различни помежду си) собствени стойности
λi = λi(А)≠ λj = λj(А), i ≠ j,
то съществуват n линейно независими десни х1,... ,хn принадлежи Cn и леви у1,..., уn принадлежи Cn собствени вектори на А, като
xHiyj = yHjхi = 0, j ≠ i.
Тук собствените вектори хi, уi съответстват на собствената стойност λi.

Ще приемем също, че собствените вектори са нормирани,
||хi||2 = ||yi||2 = 1, i = 1, ..... ,n.

Нека δА е смущение в матрицата А и нека λi +δλi, хi + δxi и yi + δyi са съответно собствените стойности, десните собствени вектори и левите собствени вектори на смутената матрица А + δА. Тук собствените вектори на смутената матрица могат и да не са нормирани.

Анализът на чуствителността на собствената структура на матрицата А се състои в намиране на оценки за смущенията
|δλi|, ||δxi||2, ||yi||2, i = 1,...,n,
като функция на смущението
α := ||δА||2.

От зависимостите
(А + δА)(хi + δхi) = (λi + δλi)(хi + δхi), i = 1,...,n,
следва
(А - λiIi)δxi + δA(хi + δхi) = δλii + δхi), i = 1,...,n. (a)
Като умножим отляво всяко от равенствата (a) с уHi получаваме
yH(А - λiIi)δxi + δA(хi + δхi) = δλiyHii + δхi), i = 1,...,n. (b)
Аналогично, умножаването отляво с уHi при j ≠ i дава
yHi(А - λiIi)δxi + δA(хi + δхi) = δλiyHii + δхi), i = 1,...,n. (c)
Bекторите х1,..., хn са линейно независими и следователно всяко от смущенията δxi може да се представи като линейна комбинация
δxi = ti,1x1 + .... + ti,nxn (d)
Умножаваме (d) отляво с уHj при отчитане и получаваме
yHjδxi = ti,jyHixi (e)
Аналогично, след умножаване на (d) с А получаваме
Аδxi = ti,1Аx1 + .... + ti,nAxn = ti,1λ1x1 + .... + ti,nλnxn.
След още едно умножение отляво на това равенство с уHj стигаме до
yHjАδхi = ti,jλjyHjхj (f)

Ако означим
γi = < xi,yi > = yHixi (g)
и заместим (e), (f) в (b), (c), получаваме
γi(1 + ti,i)δλi = yHiδA(xi + δxi), i = 1,...,n (h)
и
ti,jγji - λj + δλi) = yHiδA(xi + δxi), j ≠ i. (i)

Така за всяко фиксирано i имаме системата (h), (i) от n уравнения за n + 1 неизвестни
δλi, ti,1,.... , ti,n.
За определеност ще изберем ti, = 0. В резултат получаваме
(j)
където
δλi = yHiδA(xi + δxi)/γi (k)

В първо приближение приемаме, че числото α = ||δА||2 е малко и в (i), (k) пренебрегваме членовете от втори и по-висок ред относно α. В резултат получаваме
|δλi ≤ <Сλi||δA||2 (l)
и
(m)
Тук
Сλi := 1/|γi| = 1/|yHixi| (n)
е т.нар. абсолютно спектрално число на обусловеност на собствената стойност λi.

Въз основа на (m) имаме още
сума (o)
Неравенствата (l) и (o) са известните асимптотични оценки от първи ред за чуствителността на собствената структура на матрица с прост спектър. Недостатък на тези оценки е обстоятелството, че пренебрегнатите членове, макар и малки от втори ред относно ||δА||2, могат да се окажат от порядъка на линейните членове за конкретни задачи.

Една нелокална нелинейна оценка на чуствителността на собствената структура на матрица с прост спектър се получава както следва (вж. напр. [9]).

За фиксирано 1 ≤ i ≤ n да разгледаме уравнението
ξ = φi(ξ, α), α := ||δА||2, (p)
където

Съществува αi > 0, такова че за някое ξ0i е изпълнено
ξ0i = φi0ii)
и
1 = φ'i,ξ0ii)
При 0 < α < αi уравнението (p) има два положителни корена ξi,1, ξi,2, а при α = αi - един двоен положителен корен ξ0i. Да предположим, че α < αi, и нека
ξi,1 = ρi(α)
е по-малкият положителен корен на уравнението. Тогава са в сила нелинейните нелокални пертурбационни оценки
||δxi|| ≤ ρi(α), (q)
|δλi| ≤ Сλi(1 + ρi(α)), α ≤ αi.

Недостатък на оценките (q) е фактът, че величината ρi(α) се получава като решение на сложното дробно-линейно уравнение (p) (по отношение на търсения корен въпросното уравнение е еквивалентно на алгебрично уравнение от n-та степен). С цената на известно влошаване на оценките задачата може да се реши като дясната страна на уравнението (p) се мажорира от израза

където

Да разгледаме уравнението
ξ = ψi(ξ, α)
То има положителен корен

където
βi(α) := ωi - α(Сi + γi),
когато

Оттук получаваме оценките
||δxi|| ≤ ρi(α) с черта, (r)
|δλi| ≤ С&sub>λi(1 + ρi(α) с черта), α ≤ αi с черта.

Нека сега предположим, че матрицата А принадлежи Fnxn е диагонализируема, т.е., че съществува неособена матрица X принадлежи Fnxn, такава че матрицата Х-1АХ е диагонална. Тук, за разлика от предходния случай, матрицата А може да има и кратни собствени стойности. Нека δА е произволно смущение в А. Тогава за всяка собствена стойност λ(A + δА) на А + δА съществува собствена стойност λ(А) на А, такава че
|λ(А + δА) - λ(А)| ≤ соnd2(Х)||δА||2,
където
соnd2(х) := ||X||2||X-1||2.

Когато матрицата А е нормална (АHА = ААH) и в частност комплексна ермитова (АH = А) или реална симетрична (АT = А), то X може да се избере като унитарна матрица, при което ||Х||2 = ||Х-1||2 = 1, соnd2(Х) = 1 и
|λ(А + δА) - λ(А)| ≤ ||δА||2.
Забележително тук е, че матрицата δА може и да не е нормална, а нейната норма може да е прозволно голяма.

Ако и двете матрици А и δА са нормални, то техните собствени стойности могат да се номерират така, че
|δλi| = |λi(А + δА) - λi(А)| ≤ ||δА||2, i = 1,..., n
и
Това неравенство е известно като теорема на Хофман и Виланд.

Когато матрицата А има жорданов блок с размер р > 1 и собствена стойност λ, то смутената матрица А + δА може да има собствена стойност λ + δλ, където
|δλ| = С||δА||1/p2.
Така спектърът на матрица с кратни собствени стойности може да е извънредно чуствителен спрямо изменение в данните. Да разгледаме пресмятането на собствените стойности на матрица АеРхп чрез привеждане в Шур форма с помощта на (^К алгоритъма. Оказва се, че пресметната по този начин Шур форма е точна за леко смутена матрица А + 8А, където

Тъй като ||δА||2 ≤ ||δА||F, то получаваме, че в първо приближение простата собствена стойност λ на А се пресмята като λ с черта с абсолютна грешка
|λ с черта - λ| ≤ 2n2Сλ||A||Fерs.

Когато собствената стойност λ е p-кратна, в изчислената собствена стойност λ с черта могат да се очакват грешки до порядъка на
|λ с черта - λ| ≤ C(2n2||A||Fерs)1/p.

Аналогични оценки са в сила при пресмятане на обобщените собствени стойности на двойка матрици чрез привеждането им в обобщена форма на Шур чрез QZ алгоритъма.

10.7 Упражнения

Упражнение 10.1 Покажете, че матрицата А е особена точно когато 0 принадлежи spect(A).

Упражнение 10.2 Нека β е полином с коефициенти от F, а матрицата A принадлежи Fnxn има собствена двойка (λ,x). Покажете, че матрицата β(А) има собствена двойка (β(λ), х). В частност, за всяко к принадлежи N матрицата Аk има собствена стойност λk.

Упражнение 10.3 Нека неособената матрица А има собствена стойност λ. Покажете, че матрицата А-1 има собствена стойност 1/λ.

Упражнение 10.4 Нека сумата от елементите на всеки ред на квадратната матрица А е равна на едно и също число λ. Покажете, че матрицата А има собствена стойност λ. Упътване: разгледайте вектора [1,..., 1]T като кандидат за собствен вектор на А.

Упражнение 10.5 Квадратната матрица А се нарича:
•          идемпотентна, ако А2 = А;
•          нилпотентна, ако съществува к принадлежи N, такова че Аk = 0.

Покажете, че спектърът на всяка идемпотентна матрица съдържа само числата 0 и/или 1, а спектърът на всяка нилпотентна матрица съдържа само числото 0.

Упражнение 10.6 Намерете спектъра на n х n матрицата, всички елементи на която са равни на 1.

Упражнение 10.7 Като използвате резултата от упражнение 10.6 намерете спектъра на n х n матрицата, на която диагоналните елементи са равни на а, а извъндиагоналните - на b.

Упражнение 10.8 Нека са дадени квадратните матрици А, В, такива че
Кеr(А) ∩ Кеr(B) ≠ 0.
От какъв тип е матричният сноп λВ — А?

Съдържание на учебника по линейна алгебра


Изпратете материали(програми), свързани с математика на:

   За реклама   Дарения    Детска енциклопедия
Copyright © 2005-2012. Копирането на материали е нарушение на закона за авторските права и сайтът ще си търси правата!